Gene Gdia_0662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0662
Symbol
ID	6974059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	752961
End bp	754136
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	58%
IMG OID	643390192
Product	putative capsule polysaccharide export inner-membrane protein CtrB
Protein accession	YP_002275068
Protein GI	209542839
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3524] Capsule polysaccharide export protein
TIGRFAM ID	[TIGR01010] polysaccharide export inner-membrane protein, BexC/CtrB/KpsE family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0904257
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0442626
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGGGT TTGAAATTCC GAGCGGGACA ATCGCCTCGG CTGGTTCGGC GCTTCTCGCG 
ATTCCGCGGG GCTTTCACCG CGGACGTGGG GTCCGAAAGG CTTGGCCATT TCTGCTGGTG 
GTGATGCTGC CGACCTTCAT CGCGGCAATT TACTATTTTT TGATCGCCGC GCCGCAATAT 
GTCTCGCAGG CCGAATTCGT CGTGCGGGGG GCTTCATCCC AGCCCATGGG AATGCTGAGC 
AGCCTGCTGA CGGGGGAGGG CGGATCGTCG GCCGACGAAG ATGCCTACGT CGTGCAGGAC 
TACCTGACGT CGCGGGATGC GGCCAGAACG ATGCTTCGCA CGCAAGGGGG CGCGGCGATG 
TTCAATCGCC CCGAAGGCGA TTGGCCTGCC CGGTTCCCCA ATATCTTTAC GGGCGCGACC 
TTCGAGCATT TTTATCGCTA TTATAAGCGG CATATCACCG TTGATCTCGA TACATCGACG 
TCCATAACGA CCCTTCAGGT CCGTACCTTC CGCGCGCAGG ATTCCCAAGC CGTTGCACAG 
GCTCTTCTTG TCGCGGCGGA ACAACTCGTC AATCAGATGA ATGCGCGGAA GCGGGCCAAC 
ATGATCGGCA GCGCGGCGAA GGAACTTGCG GAAGCGCAGG ATCAACTGCG GGACGTAGAG 
GAGCAGATGG CCGCCTATCG CAATCGGGAG GCACTCTTGG ACCCACTCAA GCAAGCGGCC 
CCGATGTTGT CGAATATCAA TGAACTGCAG GTGGCGCTGA CGTCGACGCG GATACAGCTT 
GCCCAGGTTC AGACAGAATC GCCGAATAGT CCTTCGATTC CGGTGTATCA GCATCGGATC 
GCGGTGCTGG AAGATCAGAT TGCCAGGTCG AACAAGGAGG TTACGGGGTC GAAGACCTCG 
CTGGTCCCCA AGATCACGGA TTACGACGCC TTGGTGATTA AACAGGAAAT TGTCGAGAAA 
GGGTTGGCTG CGGCGGCGTC CGCCTTGATC AGCGCCAAAG GGCAGGCGGA TCGGCAGCAG 
GTCTATCTGG AGGAGATTTC GCAGCCGGAT TTGGCGGATT ATGCCACATA TCCGCAGCGG 
ATTGCCGACG TGCTGATTGT CTTTGCGACG TTCTTGATGG TCTACCTGAT GGGTAAGCTG 
ATCATTAATG GCGCGCGTGA ACACCAGATC GTGTGA

Protein sequence

MDGFEIPSGT IASAGSALLA IPRGFHRGRG VRKAWPFLLV VMLPTFIAAI YYFLIAAPQY 
VSQAEFVVRG ASSQPMGMLS SLLTGEGGSS ADEDAYVVQD YLTSRDAART MLRTQGGAAM 
FNRPEGDWPA RFPNIFTGAT FEHFYRYYKR HITVDLDTST SITTLQVRTF RAQDSQAVAQ 
ALLVAAEQLV NQMNARKRAN MIGSAAKELA EAQDQLRDVE EQMAAYRNRE ALLDPLKQAA 
PMLSNINELQ VALTSTRIQL AQVQTESPNS PSIPVYQHRI AVLEDQIARS NKEVTGSKTS 
LVPKITDYDA LVIKQEIVEK GLAAAASALI SAKGQADRQQ VYLEEISQPD LADYATYPQR 
IADVLIVFAT FLMVYLMGKL IINGAREHQI V