Gene SeHA_C2965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2965
Symbol
ID	6490391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	2909101
End bp	2910078
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	57%
IMG OID	642743122
Product	tricarboxylic transport
Protein accession	YP_002046746
Protein GI	194449752
COG category	[S] Function unknown
COG ID	[COG3181] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.00443141
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAAAAC AATTACTTCG TACCCTTACT GCAAGCATTT TATTAATGAG TACCTCTGTT 
CTGGCGCAGG AGGCGCCGTC GCGAACGGAA TGTATCGCGC CAGCCAAACC TGGCGGCGGT 
TTCGACCTCA CCTGTAAGCT GATTCAGGTG AGTTTGCTGG AGACTGGCGC TATCGAGAAA 
CCCATGCGGG TAACGTATAT GCCCGGCGGC GTCGGCGCTG TGGCTTATAA CGCGATAGTC 
GCCCAACGCC CTGGCGAACC CGGGACAGTG GTCGCCTTTT CCGGCGGTTC GCTGCTCAAC 
CTGTCGCAGG GGAAATTTGG TCGCTACGGC GTGGATGATG TGCGCTGGCT GGCAAGCGTG 
GGCACTGATT ACGGCATGAT CGCCGTGCGT GCGGATTCCC CGTGGAAGAC GCTGAAAGAT 
CTGATGACGG CGATGGAAAA AGATCCCAAC AGCGTGGTCA TTGGCGCTGG CGCCTCTATT 
GGCAGCCAGG ACTGGATGAA GTCGGCGTTG CTGGCGCAAA AGGCGAACGT CGACCCGCAC 
AAGATGCGCT ACGTTGCCTT TGAGGGCGGC GGCGAGCCGG TGACGGCATT AATGGGCAAC 
CATGTTCAGG TTGTCTCCGG CGATCTCAGT GAAATGGTGC CTTATCTGGG CGGCGACAAA 
ATCCGCGTGC TGGCCGTCTT TTCAGAAAAT CGTCTGCCGG GCCAGCTTGC CAATGTCCCT 
ACCGCTAAAG AACAGGGCTA CGACCTGGTG TGGCCGATTA TTCGCGGCTT CTACGTCGGG 
CCCAAAGTCA GCGATGCCGA TTACCAGTGG TGGGTGGATA CCTTCAAGAA GCTCCAGCAA 
ACCGACGAGT TTAAAAAGCA GCGCGATCTG CGCGGCCTGT TTGAGTTCGA CATGACCGGC 
CAGCAGCTCG ATGACTACGT GAAAAAACAG GTTACTGATT ACCGTGAACA GGCGAAAGCC 
TTCGGACTCG CGAAATAA

Protein sequence

MKKQLLRTLT ASILLMSTSV LAQEAPSRTE CIAPAKPGGG FDLTCKLIQV SLLETGAIEK 
PMRVTYMPGG VGAVAYNAIV AQRPGEPGTV VAFSGGSLLN LSQGKFGRYG VDDVRWLASV 
GTDYGMIAVR ADSPWKTLKD LMTAMEKDPN SVVIGAGASI GSQDWMKSAL LAQKANVDPH 
KMRYVAFEGG GEPVTALMGN HVQVVSGDLS EMVPYLGGDK IRVLAVFSEN RLPGQLANVP 
TAKEQGYDLV WPIIRGFYVG PKVSDADYQW WVDTFKKLQQ TDEFKKQRDL RGLFEFDMTG 
QQLDDYVKKQ VTDYREQAKA FGLAK