Gene SeHA_C4538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4538
Symbol
ID	6492276
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4418765
End bp	4419880
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	58%
IMG OID	642744610
Product	hypothetical protein
Protein accession	YP_002048187
Protein GI	194451779
COG category	[R] General function prediction only
COG ID	[COG3948] Phage-related baseplate assembly protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.15986
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATAG CCGAACCCGA CTTTATTGAC CGCGATCCCG CGCAAATCAC CAGCGAGATG 
ATTGCGCAAT ATGAAGAAGC CAGCGGTAAA AAACTCTATC CGGCGCAGGC TGAGCGGCTG 
CTCATTGACC TGTTTGCTTA TCGTGAAAAC CTTGTCCGCA TCGCTATCCA GGAGGCAGCG 
AAGCAAAACC TGGTCGCGTA TTCCCGTGCA CCGATGCTGG ATTATTTAGG CGAGCTGGTT 
GGCGTTCACC GTCTGCCCGC TCAGGCGGCA AAAACCACGC TGCAGTTTTC TGTTACTCAA 
GCGGCTAAAA GTAACCTGGT GATTCCACAG GGTACCCGCG CCAGCGCGTC GGATAGCGTG 
ATGTTCGCCA CCGACGAAGA TGTTCTGTTG CCTGCGGGCA GCCTGAGCGT TGCGGTAACT 
GCAACCTGTG TAGTGACCGG TGAACCCGGC AACAACTGGC AGCCTGCGCA AATCAGCGCG 
CTGGTAGACC GCGTGGGCAA TTACGATATC AGCGTCACCA ATCTGACGGC CTCAAGTGGC 
GGCTGCGGCG AAGAGAACGA CGACGCGCTA CGTAAACGCA TCCAGCTAGC GCCGGAAAGT 
TTCAGCAACG CGGGCAGCTA TGGCGCCTAT CGCTTCCATA CGCTCTCGGT CAGCCAGTCG 
ATTATCGACG TGGCGGTACT GGGGCCGGAT GAAGGGCTGG CGGAAGGCTG CGTGGAACTC 
TATCCGCTGA CCCTGAACGG TCTGCCGGGG CCGGAGCTTC TTGCCCAGAT CGAACGGGAG 
GTGAGCAAAG AGAAAAAGCG CCCGCTAACC GATAAGGTGA GCGCTAAATG TTCTCCGCGC 
GTGGCTTATC AGATCCGCGC CCGGCTAACG CTGTTTACCA CCGCCGATCA GGAGACGACG 
CTTGCCGCCG CGCGTGAAGC GATTAATACA TGGACGCGCT CGCGCCAGAC CCGGCTGGGC 
CAGGACATTG TGCCAAACCA GATAATTAAA GTATTGCAGG TTGATGGCGT TTACGACGTG 
GCGCTGGATA TGCCCGCGAA AAAGGTATTG CAGGCGCACG AATGGGCGGA ATGCACGGCT 
ATTGACGTGA CGATTGCCGG GGTCAGCGAT GGATAA

Protein sequence

MAIAEPDFID RDPAQITSEM IAQYEEASGK KLYPAQAERL LIDLFAYREN LVRIAIQEAA 
KQNLVAYSRA PMLDYLGELV GVHRLPAQAA KTTLQFSVTQ AAKSNLVIPQ GTRASASDSV 
MFATDEDVLL PAGSLSVAVT ATCVVTGEPG NNWQPAQISA LVDRVGNYDI SVTNLTASSG 
GCGEENDDAL RKRIQLAPES FSNAGSYGAY RFHTLSVSQS IIDVAVLGPD EGLAEGCVEL 
YPLTLNGLPG PELLAQIERE VSKEKKRPLT DKVSAKCSPR VAYQIRARLT LFTTADQETT 
LAAAREAINT WTRSRQTRLG QDIVPNQIIK VLQVDGVYDV ALDMPAKKVL QAHEWAECTA 
IDVTIAGVSD G