Gene Gdia_3375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3375
Symbol
ID	6976821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3697728
End bp	3699026
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	67%
IMG OID	643392891
Product	O-antigen polymerase
Protein accession	YP_002277716
Protein GI	209545487
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.221665
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.11504
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATGG AAAAAGCGAC CTGGCGCGGT GCGGCATTCG ATTCGGTCGC GCGATGGATC 
GCCCTGGCGA TGATGATGGT CATGCCGTTT TTCCAGTTGC GGGGACGGGC GATCAGCGAC 
GGCATCATGT CGGCCATCGG CCTGCTGTTC CTCGTGCATT GCATCCGCAC GCGCGCGAAT 
GACTGGTGGC GCCGGGGATG GTTCGCCTTC GCCCTGCTGT TCTGCGGGCT CGCGATCCTG 
TCGTCGGCCC TGCATGGATC GTCCCATGCG GTGGCCGAGG CCTGCGTCCT GATCCGGTTC 
TTCCTGTTCA GCGCGGCGCT GGAACGCTGG GTGCTGCGCG ACGCGGCCTC ACGGCGCTGG 
CTGGGGGCCG TCGTGACTGT GGCCGCGCTT TGGCTGGTGG TGGAATGCTG GCAGCAATAT 
CTGCTGGGCT ACAACATCTG GGGCTTCCCG CGCTGGCCGG ACGGGGCGCT GACGGGGCCG 
TTCTATAAAC CCCGCGCGGG CGCCGCGCTG CTGATGGTCG TGTTCCCCGG CCTGATGCCC 
TTCGCCCTGC GCCGGCTGCA GGCAGCGTCC TGGCGGCCGA AACTGGCGGG CATCGCCCTT 
ATCATGTTCC TGGTGGTGAC GATGCTGCTG ATCGGGCAGC GCATGCCCAC CCTGCTGTTC 
GGGCTGGGGC TGGTGCTGAC GGCACTGTTC GTTCCCTCGA CCCGCTGGGC GGTCTTCGCG 
GCCGGAATGG CCGGCGTGGT GGGGCTGTTC CTGCTGCCGA TCCTCTCGCC GCCGGCCTAT 
GCCAAGCTGG TGGTGCATTT CCTGGCGCAG ATCCGCGATT TTCCCGACAG CGATTACGGC 
CATATCTATA TTCGCGCGGC CGCCATGGTG CGCCAGCATC CATGGCTGGG GCTGGGCGCG 
GACGGGTTTC GCGATTTCTG TCCGAATCCG TCCTTTGCCC GCGACCTGTC GCTGTTCGGA 
TACGATTTCC ACGTCCCCGT CGGCGCCGGC TGCAACATTC ATCCCCATAA TATCTATCTG 
GAGGTCGCGA CCACGGCGGG GCTGCCCGGC CTGGCCTGTT TCGTCGCGAT GGCGGCGGCC 
TGGCTGTGGC GGATGCTGCG GGCCCTTTCG CCCGTCGAGG CCCCGCAGCA GGCCATGCTG 
TGCGTGATCT GCTGCGTGAT CTTGTGGCCG GTGGCCTCGA ACAGCGCGCT GTTCACGGTG 
CGGACGGCGG GGTGGTTCTT CCTGATGGTC GGATGGGGGC TGGCGGCGTC GCGCGACGTG 
GCGGGCGAAC GGCGGCTGAA TGCAGGGCGG CGGGCCTAG

Protein sequence

MTMEKATWRG AAFDSVARWI ALAMMMVMPF FQLRGRAISD GIMSAIGLLF LVHCIRTRAN 
DWWRRGWFAF ALLFCGLAIL SSALHGSSHA VAEACVLIRF FLFSAALERW VLRDAASRRW 
LGAVVTVAAL WLVVECWQQY LLGYNIWGFP RWPDGALTGP FYKPRAGAAL LMVVFPGLMP 
FALRRLQAAS WRPKLAGIAL IMFLVVTMLL IGQRMPTLLF GLGLVLTALF VPSTRWAVFA 
AGMAGVVGLF LLPILSPPAY AKLVVHFLAQ IRDFPDSDYG HIYIRAAAMV RQHPWLGLGA 
DGFRDFCPNP SFARDLSLFG YDFHVPVGAG CNIHPHNIYL EVATTAGLPG LACFVAMAAA 
WLWRMLRALS PVEAPQQAML CVICCVILWP VASNSALFTV RTAGWFFLMV GWGLAASRDV 
AGERRLNAGR RA