Gene HS_1586 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1586
Symbol
ID	4241113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	1800815
End bp	1802200
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	37%
IMG OID	638105172
Product	major facilitator superfamily permease
Protein accession	YP_719791
Protein GI	113461722
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000240166
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGCT TTTTGCAAAA ATATGGGTTT ACCCCAGCCT CATTTTTTCA ACTCATTCTG 
ATCACTGTTA ATGCACAATT GATTTATGCT TTTTGGGATA TTCGTAATAG CGTACCTGGT 
GGTTTTCCTG CCGCTTTAGG GGTAACGGAT CAACAAGCCG GTTATTTATA TTCTATGCAA 
GGACTTGTAA TTATTTTAGG GACTATTGCT TTAGGTTGGG TTGGTGACCG TTTTTCAATT 
CGTTCTATTA TGTTGCTATC TACGGTTGGT GTGGGTGGAA TTTCTTTATT TCTAACCCTC 
TCATCTCCAG GACTTAGCAT GCCTGTGTTA CTGGCTTGTT TCTTCTCTAT GTTATTTTTT 
AGTGAGGTAT TATTTAAACC GGCTAATTTC AAAGCATTAA GAATTTCAAC CACGGAAAAA 
CATCAAGGTA TGGTGTTTGG ATTATTTGAG TTTGGTCGTG GGTTGCTTGC TTTCCTTATC 
TCCTTGTTAT GGACGGTGAT GCTTTATTAT AAAGTCGGTC CGAAGGCAAT GATGATGACA 
AGTTGTATTA TTGTTATTAT TACTGGTATT GCAGTGTTTT TTATTGTACC TAAAGATCAA 
AAAGTCGGAG ATGAAGATAC TCAAGTTAAT ACGACCAAAG AAGCTATTCA GGGTGTTGCT 
CGTGTAGCTA AATTACCGGT TGTTTGGATT GCCGGAATTA ATGTGTTCTG TATTTATGGT 
GCGTTTGTTG CCGCTGGGAC CTATTTTGCC CGTTTTTTAC AAGGTGGATA TGGTACAAGT 
GCGGTTGCTG CGGCAGTTTT TGCAACAGTA GTTATTGCAT TGAGAATGTT ACCTTTGGTT 
TCTTCCGTTT TAGTAGAAAA AGTCTTTGCT TCTACCGCAC ACTTCATGCG AATGATGCAA 
ATTATTTTAG TGGTTATTCT TTCTGTAATT GGAATTATCT TTTTTACCAA TCATCCAGAT 
ATTTCTTTAT ATGCTGATGG TTATATTCCA GATAATACCC CAGTAGGACT CATTTCTTCC 
AGTATGTTCT GGACACTGGT AGTTCTTATG TTATGTGCAT CAGCTTGTAT CTTCATGATT 
CGAGGTGTTT ATTATGCCCC AATCGGTGAG ATGGGGGTTG ATAAAAAGCA TTCCTCAGCA 
GCAATGTCTT TCGCCATTAC TATTGGCTAT TTTCCTGCTT TATTAGCACC AATTGTATTA 
GGTGGCTTGG TTAAATCACC GGCAAAAGAT GCTACAGGAC AAATTATCCG CTCTTATTTA 
ACTGATACGC AAGTGTTAGC TTGTGCTTTC TTTGGGCTTG CGATTCTTGC GTTAATTTCT 
GTTTTTATGT CACATACTTT AATTAAAATG AAACAGAAAC AGCAATTAAA AACTAGTAAT 
CAATAG

Protein sequence

MKSFLQKYGF TPASFFQLIL ITVNAQLIYA FWDIRNSVPG GFPAALGVTD QQAGYLYSMQ 
GLVIILGTIA LGWVGDRFSI RSIMLLSTVG VGGISLFLTL SSPGLSMPVL LACFFSMLFF 
SEVLFKPANF KALRISTTEK HQGMVFGLFE FGRGLLAFLI SLLWTVMLYY KVGPKAMMMT 
SCIIVIITGI AVFFIVPKDQ KVGDEDTQVN TTKEAIQGVA RVAKLPVVWI AGINVFCIYG 
AFVAAGTYFA RFLQGGYGTS AVAAAVFATV VIALRMLPLV SSVLVEKVFA STAHFMRMMQ 
IILVVILSVI GIIFFTNHPD ISLYADGYIP DNTPVGLISS SMFWTLVVLM LCASACIFMI 
RGVYYAPIGE MGVDKKHSSA AMSFAITIGY FPALLAPIVL GGLVKSPAKD ATGQIIRSYL 
TDTQVLACAF FGLAILALIS VFMSHTLIKM KQKQQLKTSN Q