Gene Gdia_0462 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0462
Symbol
ID	6973856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	506986
End bp	508794
Gene Length	1809 bp
Protein Length	602 aa
Translation table	11
GC content	59%
IMG OID	643389994
Product	hypothetical protein
Protein accession	YP_002274873
Protein GI	209542644
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00687245
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.107968
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCGTC CATTCGCATC CTTCACCGAG TTGTCCGCGC CCCTCGTCGG CCGCAAGACC 
GGCATCAACC ATGATCTGCA AGACCGGCTT GCAGTCATGG ACGCCCGAGC GCTTCGTATC 
ATGGAACTTG CTGGAATTAG GACGCACACA CACAATGGCC GCGACATCTA CAGGATCAGT 
GAAGTCACGC TGATCGTCGA GAAAATGCCG CAAGAACGTC TGCGCCGTAC GCTCCTTATA 
CCTTCTCAGG CTTACGGAAT ACGGCGCGAG CGGGGCGATG AATTACGCTT CTACGCCGAG 
AACCACATGA AGACGCCGCT TTGTTCTGGC ACGTTCACTT GCTCCGAGAT GACCCCCATT 
GGGGGCGATC TGGTCGGAGA CATGAAGCGT CTGCGCGGGC GGATAGGTGA CATGTTGAGA 
TGGTGCCGAA GAGGGCCGTT CTCTGGTTAT GGTTTCGATG TTTTGATGCT GGCGAACGAT 
TTCGCCTTCC AGTTTCATCC GCTGACGGGT GTATCCGTCA ACGGTCACGT TAATTACTGC 
TATACGATGA AATCACCGAT GCCACCTGAA GTCTGGGAAG ACTTCCGTCG TGCCGTTCGC 
GAGAAGTTTG ATCTTGGGTT TTATGTCACT GGTCCTGTGA CTGACCTCTC GGCGCTGCTC 
GACTACATGA CGAAGTTATA CAAGGCCGAG CGAACCCGGA CCGACGAAAT CTTATTCTCG 
GACCTGTCTG ATGATGTCGC CGCCTGGTTT CTAGGACAGG TCGATCAGAT GTGGAACTTG 
ACCCCGCTGG CTGGCTTTAA GGTGTTCCGT GCCAGCCTCA AGACGGACAA GGAGAAGGTA 
GTCCGGAAGC GCGCCGTTCC GGTCCGGAAG CCGGTCAGGA CCACGGATGG CCGGTCCGTC 
GATGCGCTAG TGCCGCCGCG TCCTCGCGAA CACAGCCTCG TCGTAGCCAA GAGGCTGTCG 
CCTCGGATAT TGGCCGGTGC TGATGATTCG CCGTTCCCGC CTGGATTCAC CGAGGGACCG 
CCGAGGGTTC GTGTTCAGGA TCAGCATGTT AGCCACCCTG TGTATGCTAA TTACGCCATC 
CATTCCGATA TCGCATCGAA CCGTGAAGCT GCCGCCGCCT CGCCGCTGGG AGCGACGCCC 
CCCTCCGGGG GGCTAGCATC GGGGGCCTGT CCGTCGCCTG GCAATTCTGT GTTGGATCAA 
GGACTTGACG GGTCTGTGTA TGCTAATTCC GCCAACGGTT CCGATTTCGC AACGAAGAAG 
TCACGCGGCC ATGTCGAGAA CCTTGTGATC GCCCGCGAGC GGTCATCGCC GACCGAGGCC 
GGCATCTGGG AAACCTGGAC CCAGGTCATG AACCTGACGT TGAGGCCAGA GACAGAGGAA 
GGTGAGCGAG GTTTGGCGAT CCTCCTGAGG CACCACGAGC AGGCGACGGC GCAGGCTCGG 
CGGAATGGCT GGACCGGGCG TGTGGGTAAT CCCCTAGCGC GGTTGGCGGC CGGTCTCGTC 
GCCGCCGATT CCGCCGAGCC CCATATTCCT GATGATCAGA GCCTTTTTAT GCACGCTAAT 
TCCGCAACTC AAAACGATAT CAAAACGATT CCTGAGACCA TACCGACATC GCCCCCGTCG 
CTTCCTGACG CTCCGCCATC GTCAGCATAC AGTCACCCCT CTGCCGAGGA CGTGGCTGCG 
GCCCGTTCCG TCCTGCCTCC TGAGGTCCTG TCTCGCGGCC TTCCCGACGT GTATCTTGTC 
ATGTTGGCAA ACGGCCAAAG AAGAGAAGCT GAAATAGCCA AGCTGCCGTC AATGATGGGG 
CGGCATTAG

Protein sequence

MARPFASFTE LSAPLVGRKT GINHDLQDRL AVMDARALRI MELAGIRTHT HNGRDIYRIS 
EVTLIVEKMP QERLRRTLLI PSQAYGIRRE RGDELRFYAE NHMKTPLCSG TFTCSEMTPI 
GGDLVGDMKR LRGRIGDMLR WCRRGPFSGY GFDVLMLAND FAFQFHPLTG VSVNGHVNYC 
YTMKSPMPPE VWEDFRRAVR EKFDLGFYVT GPVTDLSALL DYMTKLYKAE RTRTDEILFS 
DLSDDVAAWF LGQVDQMWNL TPLAGFKVFR ASLKTDKEKV VRKRAVPVRK PVRTTDGRSV 
DALVPPRPRE HSLVVAKRLS PRILAGADDS PFPPGFTEGP PRVRVQDQHV SHPVYANYAI 
HSDIASNREA AAASPLGATP PSGGLASGAC PSPGNSVLDQ GLDGSVYANS ANGSDFATKK 
SRGHVENLVI ARERSSPTEA GIWETWTQVM NLTLRPETEE GERGLAILLR HHEQATAQAR 
RNGWTGRVGN PLARLAAGLV AADSAEPHIP DDQSLFMHAN SATQNDIKTI PETIPTSPPS 
LPDAPPSSAY SHPSAEDVAA ARSVLPPEVL SRGLPDVYLV MLANGQRREA EIAKLPSMMG 
RH