Gene Gdia_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2000
Symbol
ID	6975426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2222502
End bp	2223605
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	75%
IMG OID	643391529
Product	protein of unknown function DUF1058
Protein accession	YP_002276375
Protein GI	209544146
COG category	[S] Function unknown
COG ID	[COG3807] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCTTC CCTCGCCCGT CGTCCCTTCC GTTGGCACCT GCCGGCCCAG CGCCGCGCCG 
GCCGGCGGAA CCGTCCGCCG TGGCTGGCTG GTCTGCGCCG CCATCCTGGC CCCGGCCGCG 
CTGGGCGCCC CGGGCGCGGC CGCGCAGCAG ACCGCCACGC ATCACCGCCA CCACCACCAT 
CATGCGCCGG CAAACGCACC CGTGCCGGCC GCAACCGCCG CGCGCCATCA TCATCACGCG 
GCCGCCCCCG CGCCCCACGG GCACCACCCC GCCCCCCACC ATGCCGGGGC GATTCACGGG 
GGAACGCCGC CTCATCACCA TCATGTGATC GCGCCCCGCC ATGCCGCCCT TCCCCCTGCC 
GCGACGGGTG TGGCGGCCGG CGCGGCAGCG GGGGTGGCGG CCGGGACGGC GGGACCGGCG 
CAGGCCGAGA CGGCCATCCC GTCCCCCCCC GGACCGGCGG ATGCCGCCGC GATAGACAAG 
GGCACCGTGA CCGGCCTGCC GCTGCCGCGC TTCGCGGCGC TGCGCGCGGA CGAGGTGAAC 
ATGCGTTCGG GCCCTGGCCA GCGCTATCCT ATCGCCTGGG TCTATCACCG CCGCGACCTG 
CCGGTGAAAA TCGAGCGGGA ATTCGACGTC TGGCGCCTGG TCGAGGATTC CGACGGCCAG 
AAAGGCTGGG TCCATCAGGC GACGCTGGTC GGCGCACGCA CCTTCGTGGT GCCCGGGCTG 
CCGCCGGTCG ACCCCGCATC AGATGCTGCT GCCCAGGGTG CTTCTGCCCA GGGCGCCCCT 
GCCCGGAGCG GGACCGCCCC GGCCGGCGGC AAGCCCGCCG CCCCGACGCC GCAACCGGGG 
CCGGGCGGCC ATTTCGACAC CACCGTCGTC GGCCACCTTG CGGACCCGGC GGCGGCGGCC 
ACGATCCCGG GCGCCGTCAT CCTGCGCGCG GCGGCCGATG CCGCATCGGC GGTCGTCGCG 
GTGCTGAAGC CGGGTTCCGT CGGCACATTT CGCACGTGCG CCGCCGGCAC AACCTGGTGC 
AGGGTCAGCG TGCAGCATTA TTCGGGCTGG CTGGACCGGT CGTCGGTCTG GGGTCTTCTG 
CCGCAGGAGA CCATCCAGCC GTAG

Protein sequence

MTLPSPVVPS VGTCRPSAAP AGGTVRRGWL VCAAILAPAA LGAPGAAAQQ TATHHRHHHH 
HAPANAPVPA ATAARHHHHA AAPAPHGHHP APHHAGAIHG GTPPHHHHVI APRHAALPPA 
ATGVAAGAAA GVAAGTAGPA QAETAIPSPP GPADAAAIDK GTVTGLPLPR FAALRADEVN 
MRSGPGQRYP IAWVYHRRDL PVKIEREFDV WRLVEDSDGQ KGWVHQATLV GARTFVVPGL 
PPVDPASDAA AQGASAQGAP ARSGTAPAGG KPAAPTPQPG PGGHFDTTVV GHLADPAAAA 
TIPGAVILRA AADAASAVVA VLKPGSVGTF RTCAAGTTWC RVSVQHYSGW LDRSSVWGLL 
PQETIQP