Gene Hneap_2036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_2036
Symbol
ID	8535195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	+
Start bp	2179768
End bp	2181069
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	57%
IMG OID	646384417
Product	metabolite/H+ symporter, major facilitator superfamily (MFS)
Protein accession	YP_003263904
Protein GI	261856621
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00883] metabolite-proton symporter

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.70971
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGAAC GCGACGACAC CCGCCCCAAG CTGCAAAACT CACCCAGAAA AGTCCTGTTT 
GCCAGCCTGA TCGGCACCAC CATCGAGTTT TTCGACTTTT ATATCTACGC CACTGCCGCC 
GCTTTGGTGT TTCCAAAATT ATTCTTCCCT GAATCGGACC CAACGACGGC CGTCCTACAA 
TCACTGGCAA CGTTTGCCAT TGCCTTCTTT GCCCGACCGG TCGGCGCTGC CCTGTTCGGG 
CACTTCGGTG ATCGCGTCGG CCGTAAAGCC ACCCTGGTCG CCGCTCTGCT GACGATGGGG 
CTATCGACCG TGGCGATCGG CCTGCTCCCG ACCTACGACA GCATTGGCGT CGTCGCCCCT 
ACCCTACTTG CACTGTTTCG CTTCGGCCAG GGCTTGGGGC TGGGCGGCGA ATGGGGTGGC 
GCGATCCTGC TGGCGACCGA AAACGCCCCG CCGGGAAAAC GCGCCTGGTA CGGCATGTTC 
CCTCAATTGG GCGCGCCGAT TGGCTTCATT CTTTCCAGCG GCATCTTTCT GTTGCTGACC 
GCGTTTCTGA CCGACCAACA ATTTTTCGAC TTCGGTTGGC GCATCCCTTT TCTTGCCAGC 
GCGGCACTGG TGATCGTGGG GTTGTACGTA CGACTGAAAA TCACCGAAAC TCCTGCCTTT 
CAGGAAGTGG TTGAACACAA CACACGGGTC AAAACACCGA TTGCCACGGT GTTTAAAAGC 
CACTGGAAGC CCTTGATTGC AGGCACGGTC ATTGCCTTGG CGACATTTGT GACCTTCTAC 
CTGATGACTG TGTTTGCACT GACCTACGGC ACGGCGAAAA ACGGTTTGGG CTACAGTCGT 
GAAACCTTCC TGTTCGCCCA ACTGTTTGCG GTCTTGTTTT TTGCGATCAC CATTCCCGTT 
TCCAGCCTGA TTGCGGATCG ATTCGGTCGG CGTTTGACGC TGATCGTGAT CACAATCGCG 
ATCTTTTTGT TCGGCTTTGC GCTGGCCCCA CTGTTCGGTT CCGGCAATCT GACGGGCGTT 
GTGGTGTTTC TGGTGCTTGG ACTGGGACTG ATGGGGCTGA CCTACGGTCC GCTCGGCACA 
CTTCTCTCTG AGCTGTTTCC GACAGCCGTG CGCTACACCG GCACATCAAT GGCGTTCAAC 
CTGTCCGGGA TTTTCGGCGC CTCGCTCGCA CCTTATGCGG CCACGTGGCT TGCCAGCCAC 
TATGGGCTTA ACTATGTGGG CTATTATCTC TCGGCCGCTG CCGCACTGAC CTTGCTCGGC 
CTGCTCTCCA TCAAGGAGAC CAAGGATAAA ACATTCCACT GA

Protein sequence

MDERDDTRPK LQNSPRKVLF ASLIGTTIEF FDFYIYATAA ALVFPKLFFP ESDPTTAVLQ 
SLATFAIAFF ARPVGAALFG HFGDRVGRKA TLVAALLTMG LSTVAIGLLP TYDSIGVVAP 
TLLALFRFGQ GLGLGGEWGG AILLATENAP PGKRAWYGMF PQLGAPIGFI LSSGIFLLLT 
AFLTDQQFFD FGWRIPFLAS AALVIVGLYV RLKITETPAF QEVVEHNTRV KTPIATVFKS 
HWKPLIAGTV IALATFVTFY LMTVFALTYG TAKNGLGYSR ETFLFAQLFA VLFFAITIPV 
SSLIADRFGR RLTLIVITIA IFLFGFALAP LFGSGNLTGV VVFLVLGLGL MGLTYGPLGT 
LLSELFPTAV RYTGTSMAFN LSGIFGASLA PYAATWLASH YGLNYVGYYL SAAAALTLLG 
LLSIKETKDK TFH