Gene HS_0601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_0601
Symbol
ID	4240085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	+
Start bp	643495
End bp	644784
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	40%
IMG OID	638104151
Product	xanthine/uracil family permease
Protein accession	YP_718813
Protein GI	113460746
COG category	[R] General function prediction only
COG ID	[COG2252] Permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.474213
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACGAAAC GTGGTTCTAA CGTACGTCAA GAAATTATTG CCGGATTAAC AACCTTCTTG 
GCTATGGTTT ATTCAGTAAT TGTTGTACCG AATATGCTGA GTGCAGCGGG ATTTCCAGCA 
GAAAGTGTGT TTATAGCAAC TTGTTTGGTA GCAGGATTAG GTTCAATTTT AATTGGCTTA 
TGGGCAAATG CACCGATGGC GATTGGTTGT GCTATTTCAT TAACCGCCTT TACTGCATTT 
AGCTTAGTGT TGGGACAAGG TGTGAGCATT CCTGTCGCAT TAGGTGCGGT ATTTCTTATG 
GGGATAGTCT TTACTTTAAT TTCTGCAACA GGTATTCGCT CTTGGATTTT ACGTAATCTT 
CCGTCGAGTA TTGCACATGG TGCAGGTATT GGTATCGGTT TATTTTTGCT ACTTATCGCT 
ACAACGAATG TGGGTATTAT TGTAGCCAAT CAAAATGGCT TATTAGTTAA GTTTGGTGAT 
TTTACGTCTT TCTCTGTGCT GATGTCTTTG GTTGGACTTG CTGTAATTAT TGGCTTGGAA 
AAAATGCAAG TCAAAGGTGG GATCTTATGG GTTATGATCG CAATTACGAT CGCAGGGCTT 
ATTTGGGATC AAAATGTACA GTTTAAAGGC GAAATTTTCA GATTACCGAC TTTTGGTGAA 
CAATCCTTAT TTTTGGAATT GGATATTATG GGAGCATTAC AACCGGCAAT TTTACCTGTT 
GTTTTTGCCT TAGTAATGAC CGCAGTATTT GATGCAACAG GGACAATTCG TGCAGTTGCA 
GGTCAAGCAA ATTTATTAGA CAAAGATGGT CAAATTATCA ATGGCGGTAA AGCATTAACA 
GCGGATTCCG TAAGTAGCTT ATTATCTGGG GCACTTGGTA CCGCACCTGC CGCTGTATAT 
ATTGAATCTG CCGCCGGAAC TGCTGCTGGG GGTAAAACAG GTATGACAGC GATTGTTGTC 
GGTATACTGT TTTTATTAAT GCTATTTTTC CAGCCATTAG CAAGTTTGGT GCCAAACTAT 
GCAACTGCAC CTGCGTTAAT GTACGTAGGA TTATTAATGT TAAGCAATGT CAGCAAACTT 
GATTTTAGCG ATTTTGTTGG AGCAATGAGC GGACTGGTTT GTGGCGTATT TATTGTACTA 
ACTGCAAATA TTGTAACCGG AATTATGCTA GGTTTTGCAA CTTTAGTTAT CGGTCGTTTA 
GTTTGTGGTG ATTGGAAAAA ACTTAATGTA GGTACAGTCA TCATTGCCAT TGTTTTGGTT 
GCTTTTTATA TTGGCGGTTG GGCAATTTAA

Protein sequence

MTKRGSNVRQ EIIAGLTTFL AMVYSVIVVP NMLSAAGFPA ESVFIATCLV AGLGSILIGL 
WANAPMAIGC AISLTAFTAF SLVLGQGVSI PVALGAVFLM GIVFTLISAT GIRSWILRNL 
PSSIAHGAGI GIGLFLLLIA TTNVGIIVAN QNGLLVKFGD FTSFSVLMSL VGLAVIIGLE 
KMQVKGGILW VMIAITIAGL IWDQNVQFKG EIFRLPTFGE QSLFLELDIM GALQPAILPV 
VFALVMTAVF DATGTIRAVA GQANLLDKDG QIINGGKALT ADSVSSLLSG ALGTAPAAVY 
IESAAGTAAG GKTGMTAIVV GILFLLMLFF QPLASLVPNY ATAPALMYVG LLMLSNVSKL 
DFSDFVGAMS GLVCGVFIVL TANIVTGIML GFATLVIGRL VCGDWKKLNV GTVIIAIVLV 
AFYIGGWAI