Gene Gdia_1526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1526
Symbol
ID	6974936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1701560
End bp	1703263
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	70%
IMG OID	643391057
Product	type II secretion system protein E
Protein accession	YP_002275920
Protein GI	209543691
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID	[TIGR02533] general secretory pathway protein E

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.30964
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGACG CGGGATTGGA CGCTGACTCG CCGATCGACG CACTGGCGCG TTTGCTGGTC 
GAGCGGGACC GGTGCGACCC GCGCGCCATC GACCGCGCGC GCCGCGCGGC GGACCAGAAT 
GGCGGGCGCC TGGACCGGAT TCTGCTGCAA CTGGGGCTGG TGTCGGAACG CGACATGGCC 
TTGAGCTACG CGGAATTCCT GGACATGCCC CTGGCGTCCG CTGATCTCTA CCCCCGGGAA 
CCCGTCCTGA CGCAGTATCT CGGCGCCCGC TTCCTGCGTG ACATCCATGC GGTGCCGCTG 
GGCGTGGACG ACGGGACGGT CACGCTCGCC CTGCGCGATC CGCTGGACGG CTTCGCCGCC 
TCGTCGATCG CGGCGGCCAC GGGGCTGCGC GTGTCCTGCC GGGTGGCCGT GCCGATCGAA 
CTGGAAGCCG CCCTCGACCG CCTGTACCCG TCCGGGGGCG ATGACGGCGT CCAGCCCGAC 
GAGGACACGG CACCGCTGGA AGACGATGCC GAGCGGCTGA AGGACCTGGC GTCCGAGGCC 
CCGGTGATCC GCCTGGTCAA CCAGATCGTC AGCCGCGCCG TGGAAACCCA TGCCTCGGAC 
ATTCATATCG AACCGTTCGA GGACCGGCTG CGCGTGCGCT ATCGCTATGA CGGCGTGCTG 
CACGAGGTCG AAAGTCCCCC CGCGCACCTG ATCCCGGCGA TCATTTCGCG CATCAAGATC 
ATGGCCCGGC TGGACATCGC GGAACGGCGC CTGCCGCAGG ACGGCCGGAT CAAGCTGGCC 
GTGCGCGGGC ACGACATCGA TTTTCGCGTC TCCACGATCC CCTCGCTGCA TGGCGAGACG 
GTGGTGCTGC GCGTGCTGGA CCGTTCCAGC GTGCGGTTCG ACTACGCGAC GCTGGGCCTG 
CCGCCGGCCA TCGTCGCACG CCTGCGCGGC CTGCTGGCGC TGCCGAACGG CATCGTGCTG 
GTGACCGGGC CGACCGGGTC GGGCAAGACG ACCACGCTCT ATACCGGGCT GGCGGACCTG 
AACGCGGTGA CGCGCAAGGT GGTGACGATC GAGGACCCGA TCGAATACCA GCTTGGCGGC 
ATCAACCAGG TGCAGGTCCG GCCGCAGATC GGACTGACCT TCGCCGCCCT GCTGCGCGCG 
ATCCTGCGCC AGGACCCCGA CGTCATCATG GTCGGTGAAA TCCGCGACAT CGAAACCGCC 
CAGATCGCGG TGCAGGCCGC CCTGACCGGC CACCTGGTGC TCTCGACCCT GCATACCAAC 
TCCGCCGCCG CCGCCATCAT CCGCCTGCGC GACATGGGGG TGGAGGATTA CCTGCTGACG 
GCCGTGCTGC GCGGCGTGGT GGCGCAGCGG CTGGTCCGGC GGCTGTGCGG CCAGTGCCGG 
ACGCCCTACA CCCCGCCCCG GGAACTGGTC GATCGCTTCG ACCTGGAAAC GCTCGCAGGC 
GGCGGGCCCG TCACGCTGTT CCATCCCGTG GGTTGCGCCG CCTGCCGGAA CACCGGCTAT 
AGCGGCCGGC AGGCCATCGC CGAGCTTCTG GAACCGGACG AGGCGGTGGA ACGCCTGATC 
TTCGCGCGCA GCGACCACCT GGCGATCGAA CGCGCGGCGG TCGAGGCCGG AATGGTCCCG 
ATGTTCACCT CCGGCCTGGT CGCGGCCCTG AAGGGCGAGA CGACGATCGA GGAAGTGACC 
CGCAGCGTCC GGGCGGGAAC GTGA

Protein sequence

MMDAGLDADS PIDALARLLV ERDRCDPRAI DRARRAADQN GGRLDRILLQ LGLVSERDMA 
LSYAEFLDMP LASADLYPRE PVLTQYLGAR FLRDIHAVPL GVDDGTVTLA LRDPLDGFAA 
SSIAAATGLR VSCRVAVPIE LEAALDRLYP SGGDDGVQPD EDTAPLEDDA ERLKDLASEA 
PVIRLVNQIV SRAVETHASD IHIEPFEDRL RVRYRYDGVL HEVESPPAHL IPAIISRIKI 
MARLDIAERR LPQDGRIKLA VRGHDIDFRV STIPSLHGET VVLRVLDRSS VRFDYATLGL 
PPAIVARLRG LLALPNGIVL VTGPTGSGKT TTLYTGLADL NAVTRKVVTI EDPIEYQLGG 
INQVQVRPQI GLTFAALLRA ILRQDPDVIM VGEIRDIETA QIAVQAALTG HLVLSTLHTN 
SAAAAIIRLR DMGVEDYLLT AVLRGVVAQR LVRRLCGQCR TPYTPPRELV DRFDLETLAG 
GGPVTLFHPV GCAACRNTGY SGRQAIAELL EPDEAVERLI FARSDHLAIE RAAVEAGMVP 
MFTSGLVAAL KGETTIEEVT RSVRAGT