Gene SeHA_C0156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0156
Symbol
ID	6488965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	160327
End bp	161529
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	54%
IMG OID	642740438
Product	type IV pilin biogenesis protein
Protein accession	YP_002044112
Protein GI	194450042
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1459] Type II secretory pathway, component PulF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	0.0805411
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTTA AACAGCTCTG GCGCTGGCAA GGCGTTAACG ATAAAGGTCA ACTGGAACAA 
GACGTTGTAT GGGCGGACAA TCGTCTGGCG CTGATCATCA CCCTGCAACA TCAGCGCATT 
ATGCCGCTTC GCATCAAGCG CATGGGCGTT AACGCCGCAC TGTGGAAAGA AGAGCAAAGC 
GCTGAAATTA TTCATCAGTT GGCCACGCTC ATTCATGCCG GGCTGACGCT TTCAGAAGGG 
CTGGAACTCC TTGCGAAACA GCATCCCCAC CGACAATGGC AAGCGCTGTT GCGCACGCTG 
GCTCACGAGC TTGAACAGGG CGTCCCTTTT TCCAGCGCAT TAGTCTCCTG GCCGCAGGTA 
TTTCCGCCGC TCTACCAGAC GATGATCCGC ACCGGAGAAC TGACCGGCAA ACTGGCCGAA 
TGCTGCTTTG AACTGGCCCG TCAGCAAAAA GCGCAACGGC AGATTACGGT TAGCGTGAAA 
AAGGCGCTGC GCTATCCCGC CATTATTCTA ACAATGGCCG CCCTGGTCGT TTTCGCCATG 
CTGCACTTTG TCCTGCCGGA ATTTGCCGCC ATTTACCGTA GCTTCAATAC CCCGCTTCCT 
CTTCTGACAC GCGGTATTAT TGCGATAGCG CAATGGGGGT CGGCATGGGG TTGGCTCATC 
TTGTTCCTGA CGATGCTCGT TGCTATCGCT CACCGCAGGG TAAAACAAAA GCCGTCCTGG 
CAAGCGCAGC GGCAGCGTCT TCTGCTACGG CTTCCCGTTA TGGGTCGCCT GATAAGAGGC 
CAGAAACTAG CGCAAATATT CACCGTACTG GCATTAACCC AAAGCGCAGG TATTCCTTTT 
CTTCAGGGAC TGGAAAGCGC TATCGATAGT CTCGGCTGCC CTTACTGGTC ACAGCGTTTA 
ACGCAGGTAC ATCAGGAGAT CGCCGCGGGC AATCCGGTCT GGTTGGCGCT AAAAAATACC 
CAGGAATTTA GTCCGCTATG CCTGCAACTG GTCAGAACGG GCGAAGCGTC CGGTTCACTC 
GATATCATGC TGCATAACCT TGCCCGTCAC CACAGTGAAA CTACGCTGGC GCTGGCCGAT 
AATCTGGCGT CGCTGTTGGA ACCGGCGTTA TTGATCATCA CCGGCTTAAT TATCGGTACG 
CTGGTAGTGG CGATGTATTT GCCGATTTTT CATCTGGGAG ACGCGATGAG CGGGATGGGA 
TAA

Protein sequence

MSVKQLWRWQ GVNDKGQLEQ DVVWADNRLA LIITLQHQRI MPLRIKRMGV NAALWKEEQS 
AEIIHQLATL IHAGLTLSEG LELLAKQHPH RQWQALLRTL AHELEQGVPF SSALVSWPQV 
FPPLYQTMIR TGELTGKLAE CCFELARQQK AQRQITVSVK KALRYPAIIL TMAALVVFAM 
LHFVLPEFAA IYRSFNTPLP LLTRGIIAIA QWGSAWGWLI LFLTMLVAIA HRRVKQKPSW 
QAQRQRLLLR LPVMGRLIRG QKLAQIFTVL ALTQSAGIPF LQGLESAIDS LGCPYWSQRL 
TQVHQEIAAG NPVWLALKNT QEFSPLCLQL VRTGEASGSL DIMLHNLARH HSETTLALAD 
NLASLLEPAL LIITGLIIGT LVVAMYLPIF HLGDAMSGMG