Gene Gdia_2047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2047
Symbol
ID	6975474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2269401
End bp	2270489
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	68%
IMG OID	643391577
Product	cytochrome oxidase assembly
Protein accession	YP_002276422
Protein GI	209544193
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1612] Uncharacterized protein required for cytochrome oxidase assembly
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCTGC GTCCGGCCGG CAGCCGCGAC GATGCCTCGC CCATCGCGCT TCGCGACCGC 
AGGCGTATCT CGACCTGGCT GTTCGTCATC TGCTTCATGC TGATCGGCCA GATCGCGCTG 
GGCGGATACA CCCGGCTGAC CGGTTCGGGC CTGTCGATCA TGGACTGGCG GCCGGTCACC 
GGCATCATCC CGCCCTTGTC CCACGCGGAA TGGGAGCGGC AGTTCGCGCT GTACCAGACC 
ATTCCGCAGT ACAAGATCCT GCATGACGGA TTCGGGCTGG CCGGGTTCCA GAAGATCTTC 
TGGGCGGAAT GGACCCATCG GTTCTGGGCC CGGGTCATGA GCCTGGCGCT GCTGGCGCCG 
CTGATCTGGT TCGCCGTGAC CGGCGCGCTG ACGCGGGGAC TGATCGCGCG GCTGCTGCTG 
TATTTCGTGC TGGGCGGGCT GCAGGGGGCG ATCGGCTGGT TCATGGTCGC ATCGGGCTTC 
GACCAGAACA GCACGGCGGT CGAGCCGGTG CGGCTGGTCC TGCATCTGGG CTGCGCCTTC 
GCGCTGTATA TCGCCATCCT GTGGACCGCG CTGTCGGTCC GCACGCCCCG CGCCGCCTTC 
ATCCCCGCCA CGGCGGCGGT GGTGCGGACG AAGCGGCTGG TGTGGTGCGC CACGATCCTG 
ATCGGCATCA CCATCACCGC TGGCGGCTTT ACCGCCGGGA CCCACGCGGG TTTTTCCTAC 
AACACCTTTC CGCTGATGGA CGGGCGCCTG ATTCCCCATG GCTACGCCCG GCTGTCGCCG 
TTCTGGCTGA ACTGGTTCGA GAACGTGCCG GCCGTCCAGT TCGACCACCG GCTGCTGGCG 
ACCGTGACCG CGCTGGCCAT CGGGGCCTGC CTGTTCGCGG GCCTGCGCAC GCCGCAACTG 
GGCAAGCCGG CGCAGGACGC GCTGATGCTA ATGGGCTGGG CGGTCCTGAT TCAGTACGCG 
CTGGGCATCA CCACCCTGCT TCTGGTCGTT CCCGCCTGGG CCGGAACCGT GCACCAGACC 
TGGGCCGCCG TCCTTCTGAC CATCGCCATC GTGACCCTGC ACCGGCTTCG CGGCGTCGGC 
CGCGTCTGA

Protein sequence

MSLRPAGSRD DASPIALRDR RRISTWLFVI CFMLIGQIAL GGYTRLTGSG LSIMDWRPVT 
GIIPPLSHAE WERQFALYQT IPQYKILHDG FGLAGFQKIF WAEWTHRFWA RVMSLALLAP 
LIWFAVTGAL TRGLIARLLL YFVLGGLQGA IGWFMVASGF DQNSTAVEPV RLVLHLGCAF 
ALYIAILWTA LSVRTPRAAF IPATAAVVRT KRLVWCATIL IGITITAGGF TAGTHAGFSY 
NTFPLMDGRL IPHGYARLSP FWLNWFENVP AVQFDHRLLA TVTALAIGAC LFAGLRTPQL 
GKPAQDALML MGWAVLIQYA LGITTLLLVV PAWAGTVHQT WAAVLLTIAI VTLHRLRGVG 
RV