Gene SeHA_C3511 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3511
Symbol
ID	6487845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3405114
End bp	3406634
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	55%
IMG OID	642743639
Product	aerotaxis receptor
Protein accession	YP_002047253
Protein GI	194447584
COG category	[N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0840] Methyl-accepting chemotaxis protein [COG2202] FOG: PAS/PAC domain
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.00000000402751
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTTCTC ATCCCTACGT CAGCCAGCTA AATACCCCGC TGGATGATGA TACCACTCTG 
ATGTCTACGA CCGACCTGGA AAGCTATATC ACTCACGCCA ATGACACTTT TGTCCAAGTG 
AGCGGCTATC AGTTAAACGA GTTACTGGCG CAGCCACATA ATCTGGTGCG TCATCCGGAT 
ATGCCGAAAG CTGCCTTCGC AGATATGTGG TACACCCTAA AACAGGGCGA ACCGTGGAGC 
GGCATTGTGA AAAACCGGCG TAAAAACGGC GACCATTATT GGGTGCGGGC CAACGCGGTA 
CCGATGATAC GTGAAGGGCG TGTGACTGGA TATATGTCGA TCCGTACCCG CGCCACGGAT 
GATGAGGTTG CCGCCGTCGA GCCTTTATAT CAGGCGCTAA ATGAAGGGCG GTGTAGTAAA 
CGAATTCATA AAGGCCTGGT GGTTCGTCAG GGTTTGCTGG GCAAACTGCC CGCTATGCCT 
GTTCGCTGGC GAGTGCGTAG CATTATGGGG CTAATGGCCG TAATGCTGGC GTTGGCGTTG 
TTCGGTACGG ATGCCTCATG GCAGGCGTTG CTGTTGGGCG CGTTGGCGAT GCTGGCAGGT 
ACGGCGCTAT TGGAATGGCA AATTGTGCGT CCCATTGAAA ATGTGGCGAC GCAGGCGCTG 
AAAGTGGCGA CCGGCGAACG CAACAGCGTA CAACATCTTA ATCGTAGCGA TGAGTTGGGG 
CTGACGCTGA GGGCCGTGGG GCAGCTTGGC TTGATGTGCC GCTGGCTGAT CAATGACGTA 
TCAAGTCAGG TTTCCAGCGT CAGAAACGGC AGTGAAAGGC TGGCGAAGGG TAATAATGAT 
CTGAACGAAC ACACCCGTCA GACCGTGGAG AATGTTCAGG AAACGGTAAC GACCATGAAC 
CAGATGGCGG AGTCCGTGAA GCTCAATTCC GAGACGGCTT CCGCTGCGGA TAAGCTTTCC 
ATGGCGGCCA GTAGCGCGGC GACTCAGGGA GGTGAGGCGA TGGATACGGT GATTAAAACG 
ATGGATGATA TCGCTCACAG TACGCAACGT ATCGGGACGA TCACCACGCT AATTAACGAT 
ATCGCTTTTC AGACGAATAT CCTGGCGCTG AATGCGGCGG TAGAAGCGGC GAGAGCGGGC 
GAGCAGGGGA AAGGGTTTGC CGTGGTTGCT GGCGAGGTAC GCCATCTTGC CAGCCGCAGC 
GCTAATGCGG CGAACGATAT TCGTAAATTA ATTGATGCCA GCGCAACAAA GGTGCAGTCA 
GGCTCCGAGC AGGTTCACGC CGCAGGCCGT ACCATGGATG ACATTGTAGC TCAGGTGCAA 
AATGTCACCC TGCTTATCGC ACGTATCAGT CAGTCGACGC AGGAACAGAC AGATGGGCTT 
TCCAGCCTGA CCCGCGCCGT GGACGAGTTG AACCGCATAA CCCAGAAAAA TGCGGCGCTG 
GTGGAAGAGA GCGCACAAGT CTCCGCAATG GTAAAACACC GTGCCAGCCG GCTGGAGGAT 
GCGGTCACGG TACTGCATTA A

Protein sequence

MSSHPYVSQL NTPLDDDTTL MSTTDLESYI THANDTFVQV SGYQLNELLA QPHNLVRHPD 
MPKAAFADMW YTLKQGEPWS GIVKNRRKNG DHYWVRANAV PMIREGRVTG YMSIRTRATD 
DEVAAVEPLY QALNEGRCSK RIHKGLVVRQ GLLGKLPAMP VRWRVRSIMG LMAVMLALAL 
FGTDASWQAL LLGALAMLAG TALLEWQIVR PIENVATQAL KVATGERNSV QHLNRSDELG 
LTLRAVGQLG LMCRWLINDV SSQVSSVRNG SERLAKGNND LNEHTRQTVE NVQETVTTMN 
QMAESVKLNS ETASAADKLS MAASSAATQG GEAMDTVIKT MDDIAHSTQR IGTITTLIND 
IAFQTNILAL NAAVEAARAG EQGKGFAVVA GEVRHLASRS ANAANDIRKL IDASATKVQS 
GSEQVHAAGR TMDDIVAQVQ NVTLLIARIS QSTQEQTDGL SSLTRAVDEL NRITQKNAAL 
VEESAQVSAM VKHRASRLED AVTVLH