Gene Bind_3004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_3004
Symbol
ID	6198288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	3412491
End bp	3413762
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	63%
IMG OID	641706947
Product	major facilitator transporter
Protein accession	YP_001834056
Protein GI	182679910
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGACA CGACACCACC GCGAAAGGCG CAAACGAAGC CCAGCTTCCG TCCCGCATCG 
CTCGACGCGC TCAACTTCCT TCTCGCCGAC GTGCGCGGCG CGCTCGGACC TTATCTCAAC 
GTCTTTCTGA TCACGCAGCA GGGCTGGAGC CAGTCATCCG TCGGTGTCGT GACGACGATC 
GGCGGCTTGA TCGGCCTCAC GGCGCAAACA CCGGTCGGCG CCACAATCGA CGCCACGCCG 
GCGAAACGCG CCGTCGTGGT GGTGGCGCTT AGCGCCCTCG CTATTGGCGC GGTCGTCATT 
TTCGCCGTCC CGAGCTTCTG GCCGGTGCTG GCTGCCAACA CGGTGATGGC GGTCATCGGC 
GATGTCTTCG GCCCGGCCGT CGCCGCGCTA ACGCTTGGAC TGTTCGCGCA GGGGCAATTG 
GCGGCAAGGA TGGGTCGCAA TGGCGCCTTC GATCATGCCG GCAACGTTGT GGTCGCGCTG 
GTCGCCGGCG GTATCGGCTG GTTGTTCGGA CAAAGCGCGG TGTTCTTGCT TGTGCCACTC 
TTTGCCGTCC TCGCCATTGG CGCGGTGCTG TCCATTCCCG CAGCGGCGAT TGATCACGAA 
CGCGCGCGTG GAGCCGGTCC AACCAGTGGG GCTGATCGTG GTCCAGACGA TTGGCGAATT 
CTGTTCAAGA GCCGACCGCT GGTGGTCTTT GCGCTGAGCG CCGCGTTGTT TCATTTTGCG 
AACGCACCGC TGCTGCCGCT CGTTGGGCAA AAACTCGCGC TTGCGAATAA GGAATTCGCG 
ACCGCGATGA TGTCATCGTG CATCATCGCC GCGCAGTTGG TGATGCTGCC GATCGCGCTC 
TTCGCCGGAC AAAAGGCCGA GCAATGGGGT CGCAAGCCTG TGCTGCTCAT CGGCTTTGCA 
ATTCTTCCTT TGCGGGCTCT GCTTTACACC TTCTCGAACG ACAGTGCCTG GTTGATCGGC 
GTCCAGTTGC TGGATGGTGT CGGCGCCGGC ATCTGGGGCG TGCTGGCCCC GCTCGTCGTC 
GCGGATGTGA TGGCCGGGAC GGGTCAATAC AATCTGGCGC TGGGAACTGT GGCAACCGCT 
CAGGGTATCG GCGCTTCGCT CAGCGGTTTG GCGGCTGGCT TGGTCGTCGA TCATTTCGGC 
TACAATGCGG CCTTCGCCTG CTCGGCCGGC GCTTCCCTGG TAGCCTTGGC CGTACTCGGT 
CTTGCTCTGC CAGAGACGGG TCGTCCCAAG GAGACACAAG CGGCACTTGC GGCGACGCTA 
ACCGATGGTT AG

Protein sequence

MDDTTPPRKA QTKPSFRPAS LDALNFLLAD VRGALGPYLN VFLITQQGWS QSSVGVVTTI 
GGLIGLTAQT PVGATIDATP AKRAVVVVAL SALAIGAVVI FAVPSFWPVL AANTVMAVIG 
DVFGPAVAAL TLGLFAQGQL AARMGRNGAF DHAGNVVVAL VAGGIGWLFG QSAVFLLVPL 
FAVLAIGAVL SIPAAAIDHE RARGAGPTSG ADRGPDDWRI LFKSRPLVVF ALSAALFHFA 
NAPLLPLVGQ KLALANKEFA TAMMSSCIIA AQLVMLPIAL FAGQKAEQWG RKPVLLIGFA 
ILPLRALLYT FSNDSAWLIG VQLLDGVGAG IWGVLAPLVV ADVMAGTGQY NLALGTVATA 
QGIGASLSGL AAGLVVDHFG YNAAFACSAG ASLVALAVLG LALPETGRPK ETQAALAATL 
TDG