Gene Gdia_0334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0334
Symbol
ID	6973728
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	375652
End bp	376713
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	72%
IMG OID	643389866
Product	KpsF/GutQ family protein
Protein accession	YP_002274745
Protein GI	209542516
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.139935
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.203565
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAAC CCGCCTTCCA TGACGATGCC GGCGCACCCG CGGACGAGGC CCGGATCCAG 
TCCGACATCA CCGCCGCGTG CCGCGTTCTG GCGCGCGAGA GCGACGGACT GGCCCGGCTG 
GCGGCCGCCC TGCGCGCCCC GGCGGTATCC GACGAGCCGG AAGGCATCAC GCCGCTGGGC 
ACGGCCTTCG CACGGGCGGT CGATGCGTTT TCGACGCTGG CGGGCCGGGT CATCGTGACG 
GGTATCGGCA AGTCCGGCCA TGTCGGGCGC AAGATCCAGT CCACCCTGGC ATCGACCGGA 
ACGCCCTCGG TCTTCGTGCA TCCGTCCGAA GCGTCGCACG GCGACCTGGG CATGATCCAG 
CGGGGCGATG CGGTGCTGGC CCTGTCCAAT TCCGGCGAAA CGGCGGAACT GGCCGACATC 
GTGGCGCACG CCCGCCGCTA CGGCCTGCTG CTGGCCGCCA TTACCGCCGC ACCCGATTCG 
ACCCTGGCCC GGGCCGCCGA CATCGCCCTG ATCGTGCCGA AGGCGCCGGA GGCCTGCCCG 
ATGGGCCTGG CCCCCACCAC GTCGACGACC ATGCAGATGG CGCTGGGCGA CGCGCTGGCC 
GTTGTGCTGC TGGAGCGGCG AAATTTCTCC GCCACCGATT TCGGCGTCTT CCATCCCGGC 
GGCCGGCTGG GCACGCGGCT GCGCCGCGTC AGCGACCTGA TGCATCGGGG CGCCGCCATG 
CCGCTGGGCA CGCCGGACAT CGCGATGCGC CAGGTCATCA TGGAAATGAC GCGCAAGGCC 
TTCGGCTGCA TCGGTGTCGT CTCCCCGGAC GGGCGGCTGC GCGGGCTGAT CACCGACGGC 
GACCTGCGCC GGGCGCTGGA CCGCGACCTG GACAGCACGC TGGCCGCCGA CATCATGAAC 
CCCACCCCGC TGACCACCGG CCCCGACGTG CTGGCGGCCG AGGCCCTGCG CCTGATGAAC 
GCGCGGGCGC GGCCGATCAC CAGCCTGTTC GTGGTGGACG CGGCCGGGCT CCCGGTCGGC 
ATCCTGCATA TCCACGACCT TCTGCGGGCG GGCGTCGCAT GA

Protein sequence

MTQPAFHDDA GAPADEARIQ SDITAACRVL ARESDGLARL AAALRAPAVS DEPEGITPLG 
TAFARAVDAF STLAGRVIVT GIGKSGHVGR KIQSTLASTG TPSVFVHPSE ASHGDLGMIQ 
RGDAVLALSN SGETAELADI VAHARRYGLL LAAITAAPDS TLARAADIAL IVPKAPEACP 
MGLAPTTSTT MQMALGDALA VVLLERRNFS ATDFGVFHPG GRLGTRLRRV SDLMHRGAAM 
PLGTPDIAMR QVIMEMTRKA FGCIGVVSPD GRLRGLITDG DLRRALDRDL DSTLAADIMN 
PTPLTTGPDV LAAEALRLMN ARARPITSLF VVDAAGLPVG ILHIHDLLRA GVA