Gene Gdia_2389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2389
Symbol
ID	6975819
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	2648837
End bp	2650099
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	59%
IMG OID	643391913
Product	major facilitator superfamily MFS_1
Protein accession	YP_002276755
Protein GI	209544526
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAGC CGCATACCAC TGCAGCCTGT ACTGGCAAAA CCCTCGCTAT TCCGAGGCTC 
AATCGGGCCT TGTTTGCCTT ATGCGCTCTC AATTTCTTCA TGGCGGACGT CCAAGCGGGG 
ATAGGGCCCT TTCTGGGCGT TTTTCTTCAG CGTCACGGCT GGCAGACGGG ACCGATCGGA 
ACCGTCATGA CCGTGGGAGG CGTTGCCGGA ATGCTCGCCA CCATTCCCGC GGGCGCGCTG 
ATTGATCACA CGACGAAAAA GCGGTTGCTC GTCATTGTGG CAGCGCTCTG CACGATTTCC 
GCGTCACTCC TTCTGCTAAG CTCGCAAGCG GTGCCGGTTG TGACGGTCAG TCAACTTGCA 
ACCGCTCTGG CCGGAGCCGG GATTGGTCCT CTGATGGCGG CCATAACGCT CGGGATCGTG 
CGCCAGAAAG GCTTCAACAC ACAAATTGGC CGTAATCAGG CCTGGAACCA CGCCGGCAAT 
ATGGCCGGGG CCGGACTGTC TGGCTGGCTC GGTTGGCAGT TTGGCCTCTC AGCGATTTTC 
TTTCTTGAAG TCGCCTTCGG TCTGTTCGCC ATTTCTGCGG TGCTCCTGAT CCCGGAAAAA 
TCCATAGATC ATAAAGCTGC ACGCGGACTG GACGATGAAC CTGCTCACGA TGAGGGGACG 
ACCGAGGGGC TACGATCCTT TCTGCGACAC AAGCCTCTTC TCATTCTGGC GAGTTGTTTG 
TGTTTCTTCC ATCTCGGAAA TGCCGCGATG CTCCCGCTCT ACGGCATGGC GGTCGTCAGT 
GCAGGCAAAG GTAATCCCGC CATGTTCACG GCGATGACTG TGATGGTCGC ACAGGCTGTG 
ATGATCGTCG TGAGCCTGCT GGCCATACGT GTCGTCAGGA ACCGTGGGTA CTGGATCGTC 
CTGCTGATAT CGTTTGCCGC CCTACCGCTG CGTGGTTTGA TCGCGGGAAG CTTCATCCAG 
CATTGGGGGG TGTGGCCGGT GCAGATCCTC GATGGGATCG GTGCGGGGCT TCAGAGTGTC 
GCCGTGCCGG GTCTGGTGGC CAGACTGCTG AACGGAACCG GACGCATCAA TATCGGACAG 
GGTGTGGTCA TGACGGCGCA GGGCATTGGA GCAAGCCTTT CTCCGGCTCT GGGAGGATGG 
CTTGCCGAAG ATCTGGGATA TCCGGTGGCG TTTTATAGTC TGGGCTGTTT TGCAATCTTG 
TCACTGGGGC TCTGTATAGG CTCGGCATCG ATCCTACGCT CTGCCGATCA GGTGTCGGCA 
TGA

Protein sequence

MTQPHTTAAC TGKTLAIPRL NRALFALCAL NFFMADVQAG IGPFLGVFLQ RHGWQTGPIG 
TVMTVGGVAG MLATIPAGAL IDHTTKKRLL VIVAALCTIS ASLLLLSSQA VPVVTVSQLA 
TALAGAGIGP LMAAITLGIV RQKGFNTQIG RNQAWNHAGN MAGAGLSGWL GWQFGLSAIF 
FLEVAFGLFA ISAVLLIPEK SIDHKAARGL DDEPAHDEGT TEGLRSFLRH KPLLILASCL 
CFFHLGNAAM LPLYGMAVVS AGKGNPAMFT AMTVMVAQAV MIVVSLLAIR VVRNRGYWIV 
LLISFAALPL RGLIAGSFIQ HWGVWPVQIL DGIGAGLQSV AVPGLVARLL NGTGRINIGQ 
GVVMTAQGIG ASLSPALGGW LAEDLGYPVA FYSLGCFAIL SLGLCIGSAS ILRSADQVSA