Gene Gdia_1952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1952
Symbol
ID	6975378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2166724
End bp	2168172
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	67%
IMG OID	643391481
Product	sugar transporter
Protein accession	YP_002276327
Protein GI	209544098
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00879] MFS transporter, sugar porter (SP) family

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAATT TTTCACCGCA GGCCCCTTCG GTTCCCGCCC TGTCCGATTT CGAGGTTTCG 
GACAATGCGG GGCGGACGCT CTGGCTCGCA GCCGCCGTGG CCGCCATCTG TGGCGGCCTC 
TACGGCTACG ACACCGGTAT CATTTCGGGT GCGTTGCTTC TGATTACCCG GGATTTCCAT 
CTGGGCAGCC TGTATCAGGA ACTGGTCGCC TCCGCGATCC TGGCGGGGGC GGTGCTGGGC 
GCCGTCGGCA CCGGCTGGCT GTCGGAACGG TTCGGCCGCC GGACGTCGGT CATGATCGTC 
ACCGCCGTGT TCGTGACCGG CGCGCTGGCC TGCGCCGCCG CCCCGGATGT GGACATGCTG 
ATCGCGGCAC GCGTCTATCT GGGGCTGGGG GTCGGCGGAT CGACCCAGGT GGTTCCGATG 
TATATCTCGG AACTGGCGCC GGCGGCCCGG CGCGGCAAGC TGGTCACGCT GTTCAACGTC 
GCGATCGGGA TCGGCATCTT CGTCGCCAAC ATCATCGGTT TCGCCGCGCG CGACGCCTGG 
GGCTGGCGGC CGATGATCGC GGTCGCGGCC CTGCCGGCGG CACTGGTATT CGTGTCCATG 
TTCTTCCTGC CCAAGAGCCC CCGCTGGACG GCGGAAAACG AGGGACTGGA TTCCGCGGTC 
ACGCATCTGG CGCGCGTGCG GACGTCGCGC AAGGAAGTCC GCAAGGAAAT CCGCAGGATC 
CACGAAGCCG CGGAAGACGT CGATGACGCG CATCGCGGCT GGCGCGGCCT GATGCAGCCC 
TGGGTGCGCC CGGCGCTGGT CGCGGCGCTG GGGGTGGCCT TCTTCACCCA GTGCGGCGGG 
CTGGAGATGA TGATCTATTA CGCCCCGACC TTCCTGTCGG ACGCGGGCTT CGGCCATTCC 
TCGGCGCTGC TGGCCAGCCT GGGGGTCTCG ATGGTCTATC TGGTCATGAC GATGCTGGGC 
TCGGCGATCG TCGATCATGT CGGCCGGCGC CGCCTGATGC TGATCATGGG GCCGGGATCG 
GTGGCCAGCC TGCTGGGGCT GGGGCTGATG TTCGCCATCC ATCCCGACAA GGGCAGCGTC 
GGAAGCTGGA TGATCATCGT GTTCCTGCTG ATGTTCATGG CGTTCAATTC CGGCGGCATC 
CAGGTCGTCG GCTGGCTGCT GGGGGCGGAA ATGTTCCCGC TGTCGATGCG CGGCACCGCC 
ACCAGCCTGC ACGCCGCGAC CCTGTGGGGC AGCGACCTGC TGGTGACCAG CACGGCGCTG 
ACGCTGGTCA ACCTGATCTC GCTGGGCGGG ACGATGTGGT TCTATGCCGG GGTCAATCTG 
GCGTCGGTCG CGTTCATCTA CTTCCTGGTG CCAGAGACGC GCGGTGCATC ACTGGAAGAC 
ATCGAAACCG CCCTGCATGA GGGGCGCTTC CGGCCCACCA GGGGCCATAC CGCGATCGTC 
GAGACCTGA

Protein sequence

MQNFSPQAPS VPALSDFEVS DNAGRTLWLA AAVAAICGGL YGYDTGIISG ALLLITRDFH 
LGSLYQELVA SAILAGAVLG AVGTGWLSER FGRRTSVMIV TAVFVTGALA CAAAPDVDML 
IAARVYLGLG VGGSTQVVPM YISELAPAAR RGKLVTLFNV AIGIGIFVAN IIGFAARDAW 
GWRPMIAVAA LPAALVFVSM FFLPKSPRWT AENEGLDSAV THLARVRTSR KEVRKEIRRI 
HEAAEDVDDA HRGWRGLMQP WVRPALVAAL GVAFFTQCGG LEMMIYYAPT FLSDAGFGHS 
SALLASLGVS MVYLVMTMLG SAIVDHVGRR RLMLIMGPGS VASLLGLGLM FAIHPDKGSV 
GSWMIIVFLL MFMAFNSGGI QVVGWLLGAE MFPLSMRGTA TSLHAATLWG SDLLVTSTAL 
TLVNLISLGG TMWFYAGVNL ASVAFIYFLV PETRGASLED IETALHEGRF RPTRGHTAIV 
ET