Gene HS_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1039
Symbol
ID	4240537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	1145754
End bp	1147193
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	38%
IMG OID	638104600
Product	amino acid carrier protein
Protein accession	YP_719251
Protein GI	113461182
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1115] Na+/alanine symporter
TIGRFAM ID	[TIGR00835] amino acid carrier protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTTCAA CTATAATAAT AAACATTGAA CAAGCACTAA GTTGGTTTGT TGATAAATTT 
GATGGACCAC TATGGGATTT AGCGACTATT ACATTACTTG GTGTAGGTGT GTTTTTTACG 
TTAGCAACCG GCTTTATTCA ATTACGTTTA TTTCCACAAA GTTTGCGTGA AATGTGGTTT 
GGACGGGCAG TTCAAGGACA ATCTTTAACG CCATTTCAGG CATTTACTAC TGGTTTAGCC 
AGCCGTGTAG GTGTGGGTAA TATCGGAGGC GTTGCAACGG CAATAGCACT TGGCGGGGAA 
GGTGCTGTCT TTTGGATGTG GGTAACGGCG TTGATTGGAA TGTCCAGTGC ATTTGCTGAA 
TCTTCTTTGG CTCAGTTATT TAAAGTTAAA GATAAAAACG GGTTATTTCG TGGCGGACCT 
GCCTATTATA TTACAAGAGG ATTGAAAGCT CCTTGGTTGG CAGTATGTTT TGCAATTGCT 
TTAATATTTA CGTTCGGATT TGCGTTTAAT GCAGTTCAAT CCAATGCTAT TGTTGAGGCA 
ACAAAAAATG CTTGGAAATG GCAACCGCAC TATGTCGGGG TAACTCTCGT TATCGTAACG 
GGGTTAATTA TTTTTGGTGG AGTGAAACGT ATTGGTAAAG TTTCTGCACA AATTGTTCCT 
ATGATGGCGT TGTTTTATCT AATCATTGCG GTGATTATTT TAGGTATGAA TATTGAAATG 
GTACCGACAG TGATAAGCCG TATTATTCAA AGTGCTTTTA ATTTTGACGC AATGGCTGGT 
GGTATGTTCG GTGCAATTTT TTCTAAAGCT ATGTTAATGG GAATTAAACG AGGACTTTTC 
TCTAATGAGG CAGGTATGGG GTCTGCACCA AATGCGGCAG CATCGGCAGA TGTTAAGCAC 
CCTGTAAGTC AAGGGTTGAT CCAAATGCTG GGTGTGTTTG TAGATACTAT TATTGTGTGT 
ACTTGTACTG CGGTGATTAT TTTATTATCA GATAATTATG GTGGCGAACA ACTGAAAAAC 
ATTTCATTAA CCCAATATGC TTTACAGTAC CATGTTGGTG AATTTGGCTT ACATTTCTTA 
GCTTTTATCC TATTGTTATT TGCATTTTCT TCTATTATCG GAAACTACGC TTATGCAGAA 
AGTAACATTC GTTTTATTCG CAATAAACCA TTGTTTATTC TCACTTTCCG TTTAATTGTG 
TTGTTCTTTG TGTATTTTGG TGCAGTCAAT TCAGGAAATA TTGTATGGAA CTTTGCAGAT 
ACGGTGATGG CGATTATGGC ATTAATTAAC CTTGTGTCTA TTGTTTTATT GGCACCGATA 
GTTATGTTGT TGCTAAAAGA TTACCGCCAA CAGCTCAAAG CGGGTAAAGA TCCTGAATTT 
AAAATTGAAC AATACCCTCA ATTACTTCGT AAAGGCGTTG ATCCTACTCT TTGGAAATAA

Protein sequence

MFSTIIINIE QALSWFVDKF DGPLWDLATI TLLGVGVFFT LATGFIQLRL FPQSLREMWF 
GRAVQGQSLT PFQAFTTGLA SRVGVGNIGG VATAIALGGE GAVFWMWVTA LIGMSSAFAE 
SSLAQLFKVK DKNGLFRGGP AYYITRGLKA PWLAVCFAIA LIFTFGFAFN AVQSNAIVEA 
TKNAWKWQPH YVGVTLVIVT GLIIFGGVKR IGKVSAQIVP MMALFYLIIA VIILGMNIEM 
VPTVISRIIQ SAFNFDAMAG GMFGAIFSKA MLMGIKRGLF SNEAGMGSAP NAAASADVKH 
PVSQGLIQML GVFVDTIIVC TCTAVIILLS DNYGGEQLKN ISLTQYALQY HVGEFGLHFL 
AFILLLFAFS SIIGNYAYAE SNIRFIRNKP LFILTFRLIV LFFVYFGAVN SGNIVWNFAD 
TVMAIMALIN LVSIVLLAPI VMLLLKDYRQ QLKAGKDPEF KIEQYPQLLR KGVDPTLWK