Gene SeHA_C4021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4021
Symbol
ID	6492307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3903143
End bp	3904198
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	54%
IMG OID	642744121
Product	LacI family transcriptional regulator
Protein accession	YP_002047726
Protein GI	194451248
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAATA ATGCGCGGAT AAATCAGCCA ATCTTTGCAG GGGCATCAGA CGTGAAGAGA 
ACCAAATCAC CTCGTGCGCC GACGCTGGAA GATGTAGCAC GTAGCGCCGG GCTGTCTCCG 
ATGACAGTCA GCCGGGCATT GAATTCGCCA CAACTGGTTC GCCCCAAAAC GGTTGAGAAA 
GTCATGCAGG CGGTTCGCGT TACAGGCTAC ATACCCAACG CGTTAGCCGG TGGTCTGGCG 
TCGCGACGGA GTAAATTAAT CGCTGTCGTC GTGCCGCAAA TTAACAACAA CATGTTTGTC 
GATACCATCC AGTCGCTGAG CGATGAACTG GCCCGACGCG GATATCACAT ATTGCTGTGC 
GTGGCGGGAT ATACCGAACA AACGGAAGCG GAATTGGTGG CGACACTGCT TTCCCGCCGC 
CCCGATGGCG TGGTGCTTAC CGGGATCCAT CACACGATAG AACTGAAAAA GGTCATCCTG 
AACGCGGCTA TTCCGGTGGT GGAAATTTGG GACTTAACGC CCACGCCGCT TGATATGCTG 
GTCGGTTTTT CCCATGAAAA AGTCGGGCAG GCGACGGGGG AGTATCTTCT GAGTAAGGGC 
TATCGTCGTC CCGGATTGTT GTGGACCGCC GATCGCCGAG CCGCGCAACG TAAGCAGGGG 
TTATGTAGTG TTCTTCAACG CCACGCTATT CATGCCGTAC CGCAGGTGGA TGTCCCCCTT 
CCGGCATCGC TTTCGCTGGG GCGTAGCGGT TTAAGCCAGC TTTTTGACGA AGGGACGTTT 
GATGTCATTG TTTGCAGTTC TGATACCCTG GCACAGGGGG CGATGATGGA GGCGGAAAGC 
CGTGGTTTGC GCATCCCGCA TGATTTAGCG GTTATTGGTT TTGGCGATCT TGATTTTGCC 
GCCAGCAATC GACCGTCAAT TACTACCGTA AGCGTTGACA GACGCGCCAT TGGCCAGCGC 
GCCGCTACGC TGTTGGCCGA TCGTATTGAA CAGAAACCGT GCGCAGAAGC TATTGTGGAT 
ATTGGCTTTC ATTTGATTGA GCGAGAGTCC GCATAA

Protein sequence

MMNNARINQP IFAGASDVKR TKSPRAPTLE DVARSAGLSP MTVSRALNSP QLVRPKTVEK 
VMQAVRVTGY IPNALAGGLA SRRSKLIAVV VPQINNNMFV DTIQSLSDEL ARRGYHILLC 
VAGYTEQTEA ELVATLLSRR PDGVVLTGIH HTIELKKVIL NAAIPVVEIW DLTPTPLDML 
VGFSHEKVGQ ATGEYLLSKG YRRPGLLWTA DRRAAQRKQG LCSVLQRHAI HAVPQVDVPL 
PASLSLGRSG LSQLFDEGTF DVIVCSSDTL AQGAMMEAES RGLRIPHDLA VIGFGDLDFA 
ASNRPSITTV SVDRRAIGQR AATLLADRIE QKPCAEAIVD IGFHLIERES A