Gene Gdia_1803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1803
Symbol
ID	6975225
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1996523
End bp	1997458
Gene Length	936 bp
Protein Length	311 aa
Translation table	11
GC content	72%
IMG OID	643391328
Product	putative extracellular solute-binding protein, PotD/PotF family
Protein accession	YP_002276178
Protein GI	209543949
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.826481
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.262501
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGTTCT GTCTCACGGT ACTGGTCGGG AACGATGCCC GGGCCGGATG GCGGGCGCAC 
GCCCTGGTTG TCGAAGGCTG GGGCGGCGCC CTGGGCAAGG CGCAGGACCA GGCCTTCTTT 
CGTCCCTTCG CCGCCAGTAC GGGGACCGGA ATCCTCCGCT ATGTGTGGGA TGGCGGCAGC 
CTGCCCGCTC CGGCGGGCCG GCATGCCTGG GCCCTGGCCC TGGTGGAGGA CAGCACGGCC 
CGCATCGCCT GCATGCAGGG CCGCCTGCAG CGCCTGGGCG GCAGCCCCGG CAGCGCGGAT 
GCGTGCGGCG TGCCCGCGCT GCATGACGGC ATTGCCCTGG CATGGGACCG TGGCCGCATT 
CCGGCCGCCC CGCACTGGAG CGATTTCTGG AACATCGTCC GCTATCCCGG CAAGCGCGGC 
CTGCGCAAGG ACCCGCGCTC GACGCTGGAA ATCGCCCTGA TGGCCGACGG CGTGGCGCCG 
TCGGACGTCT ATACCGTGCT GGCGACGCCC GAGGGGGTCG ACCGCGCGTT CCACAAGCTC 
AGCCAGTTGC GTCCCTATAT CGTCTGGTGG ACCAGCGCCG CGGAATCCGC GCGGATCATA 
GGTGACGGCA GCGTGCTGAT GACCAGCGCC GCGGGGGGCG AGGTCGCGGC GTCGGCCAGT 
TCCGGCCACC GCGATGTCGG CCTCCAGTGG GCGCAGAGCC TGGATGACGG CCTGTCCTGG 
GGTGTCGCAC CGGGGCTGGA CAGCACGGTT CGCGACCGGG CCCGCGCCCT GCTGCATTAT 
ATGTCCCAGC CCGAGCAGAT CGCGCGCTTC GCCGGCCTGT ACCACGCCCG CCCCGACGAT 
CCGTCGCTGC AGCCGATGCC GATGGACGCC GCGTTCTGGC AGGCCCATCT GCCCGGGTTG 
GCCAAGCGGT TCGCGGACTG GCTGGCGACG CCGTGA

Protein sequence

MLFCLTVLVG NDARAGWRAH ALVVEGWGGA LGKAQDQAFF RPFAASTGTG ILRYVWDGGS 
LPAPAGRHAW ALALVEDSTA RIACMQGRLQ RLGGSPGSAD ACGVPALHDG IALAWDRGRI 
PAAPHWSDFW NIVRYPGKRG LRKDPRSTLE IALMADGVAP SDVYTVLATP EGVDRAFHKL 
SQLRPYIVWW TSAAESARII GDGSVLMTSA AGGEVAASAS SGHRDVGLQW AQSLDDGLSW 
GVAPGLDSTV RDRARALLHY MSQPEQIARF AGLYHARPDD PSLQPMPMDA AFWQAHLPGL 
AKRFADWLAT P