Gene SeHA_C2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2049
Symbol
ID	6492099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	1992420
End bp	1993703
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	52%
IMG OID	642742250
Product	hypothetical protein
Protein accession	YP_002045893
Protein GI	194450916
COG category	[S] Function unknown
COG ID	[COG2995] Uncharacterized paraquat-inducible protein A
TIGRFAM ID	[TIGR00155] integral membrane protein, PqiA family

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	90
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCTGA ACACCTCACA CGTCACGCCA ACAAAAAAGC TAACGATCAG GTCAATTAGC 
GAAGCGCTGC CGCGCAGCCA CTACCAGCGC TGCCCTGAAT GCGACATGCT GTTCAGCTTG 
CCGGAGATGA GCGCTCATCA AAGCGCTTAT TGTCCTCGTT GCCAGGCCAA AATTCGCGAT 
GGGCGCGACT GGTCGCTGAC GCGGCTGACC GCGATGGCAG TAACCATGCT GCTATTGATG 
CCGTTTGCCT GGAGCGAACC GCTACTCCAT ATCTACCTGT TGGGCGTACG CATTGATGCC 
AATGTGATGC ACGGCATCTG GCAAATGACG CAGCAGGGCG ATCCGTTAAC CGCCGCAATG 
GTGCTCTTTT GCGTGGTGGG CGCGCCGCTT ATTCTGGTTT TTTCAATTGC TTATCTGTGG 
TTTGGCAGCC TTCTCGGCAT GAATCTGCGT CCAGTCCTGC TGATGCTGGA AAAACTGAAA 
GAGTGGGTGA TGCTGGACAT CTATCTGGTC GGTATTGGCG TTGCCTCTAT CAAAGTGCAG 
GACTATGCCT TTCTGCAGCC GGGCATCGGG CTTTTAGCGT TCGTCTCGTT GGTGGTTCTT 
AGCATTCTGA CTATGATTCA TCTGAATGTG GAGCAACTAT GGGAACGATT TTATCCGCAG 
CGCCCTGCTC AACGTGCGGA CGAAAGATTG CGCGTCTGTC TTGGCTGCCA CTTTAGCGGC 
TATCCGGATG CGAAAGGACG CTGCCCGCGT TGTCATATTC CGCTACGGTT ACGCAGAAAA 
CAGAGCATAC AGAAGTGTTG GGCGGCCTTG CTGGCGTCTA TTGTCTTTTT GCTGCCGGCA 
AACCTGCTGC CTATCTCGGT AATCTACATT AATGGCGGGC GTCAGGAAGA TACTATCCTG 
TCGGGCATTA TGTCGCTTGC CAGCAGCAAT ATCGCCGTCG CCGCCGTCGT TTTTATCGCC 
AGTATTTTGG TGCCGTTTAC CAAAGTCATC GTGATGTTTA CGCTACTGTT GAGTATCCAT 
TTTAAATGCC AACAGGGACT GCGGACGCGA ATTCTGTTGC TGCGTCTGGT GACATGGATA 
GGCCGCTGGT CGATGCTGGA TCTTTTCGTT ATCTCGTTAA CCATGTCTCT GATTAATCGC 
GATCAGATTC TGGCTTTTAC TATGGGACCG GCTGCGTTTT ATTTCGGCGC AGCGGTAATT 
TTGACTATTC TTGCAGTGGA ATGGCTGGAT AGCCGCTTAC TTTGGGATGC ACATGAGTCA 
GGAAACGCCC GCTTCGAAGA CTGA

Protein sequence

MALNTSHVTP TKKLTIRSIS EALPRSHYQR CPECDMLFSL PEMSAHQSAY CPRCQAKIRD 
GRDWSLTRLT AMAVTMLLLM PFAWSEPLLH IYLLGVRIDA NVMHGIWQMT QQGDPLTAAM 
VLFCVVGAPL ILVFSIAYLW FGSLLGMNLR PVLLMLEKLK EWVMLDIYLV GIGVASIKVQ 
DYAFLQPGIG LLAFVSLVVL SILTMIHLNV EQLWERFYPQ RPAQRADERL RVCLGCHFSG 
YPDAKGRCPR CHIPLRLRRK QSIQKCWAAL LASIVFLLPA NLLPISVIYI NGGRQEDTIL 
SGIMSLASSN IAVAAVVFIA SILVPFTKVI VMFTLLLSIH FKCQQGLRTR ILLLRLVTWI 
GRWSMLDLFV ISLTMSLINR DQILAFTMGP AAFYFGAAVI LTILAVEWLD SRLLWDAHES 
GNARFED