Gene SeHA_C2955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2955
Symbol
ID	6489917
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	2901312
End bp	2902412
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	44%
IMG OID	642743112
Product	effector protein pipB2
Protein accession	YP_002046736
Protein GI	194449126
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.000000403936
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATAAATT TTATCATGCA CTGTGTTGCT GTCTCTGGGA GAAAATATAT GGAGCGTTCA 
CTCGATAGTC TGGCTGGTAT GGCTAAATCT GCTTTTGGCG CGGGGACTTC TGCTGCTATG 
CGGCAAGCTA CCTCGCCCAA AACCATTCTG GAATATATCA TTAACTTTTT TACCTGTGGT 
GGGATACGTC GGAGAAATGA AACACAATAT CAGGAATTGA TAGAGACTAT GGCTGAGACA 
TTGAAAAGTA CAATGCCTGA CAGAGGTGCT CCGTTGCCAG AAAACATCAT CCTGGATGAT 
ATGGATGGGT GTCGTGTCGA ATTTAATCTT CCTGGTGAGA ATAACGAAGC TGGACAAGTT 
ATTGTACGAG TCAGTAAAGG CGACCATTCT GAGACAAGAG AAATTCCGCT TGTCTCTTTT 
GAAAAAATAT GTCGAGCTTT ACTATTCAGA TGCGAATTTT CTCTCCCTCA GGATTCTGTA 
ATATTAACTG CCCAGGGAGG CATGAATCTT AAAGGCGCTG TCCTTACCGG AGCAAATCTG 
ACGTCAGAAA ATTTATGTGA CGCAGACTTA AGCGGCGCAA ATTTAGAGGG GGCAGTGCTG 
TTTATGGCGG ATTGTGAAGG TGCAAATTTT AAGGGCGCAA ATCTATCGGG AACATCACTA 
GGCGACAGTA ATTTCAAGAA CGCCTGTCTG GAAGATAGCA TTATGTGTGG CGCTACCCTC 
GATCACGCTA ATCTTACTGG CGCCAATTTA CAACACGCGA GTCTGTTAGG CTGTAGCATG 
ATAGAATGTA ATTGCTCCGG TGCAAATATG GATCACACTA ATCTTTCAGG CGCAACCCTT 
ATACGTGCTG ATATGAGCGG TGCGACATTA CAGGGTGCTA CTATAATGGC TGCAATTATG 
GAAGACGCTG TCTTAACCCG GGCAAATCTG CGAAAGGCGA GTTTCATTTC TACGAACCTG 
GACGGGGCTG ATTTGGCTGA GGCTAATTTA AACAATACCT GTTTTAAAGA TTGTACACTA 
ACCCATTTGC GTACCGAAGA CGCCACAATG TCTACAAGTA CACAAACACT CTTTAACGAA 
TTTTATAGTG AAAATATTTA G

Protein sequence

MINFIMHCVA VSGRKYMERS LDSLAGMAKS AFGAGTSAAM RQATSPKTIL EYIINFFTCG 
GIRRRNETQY QELIETMAET LKSTMPDRGA PLPENIILDD MDGCRVEFNL PGENNEAGQV 
IVRVSKGDHS ETREIPLVSF EKICRALLFR CEFSLPQDSV ILTAQGGMNL KGAVLTGANL 
TSENLCDADL SGANLEGAVL FMADCEGANF KGANLSGTSL GDSNFKNACL EDSIMCGATL 
DHANLTGANL QHASLLGCSM IECNCSGANM DHTNLSGATL IRADMSGATL QGATIMAAIM 
EDAVLTRANL RKASFISTNL DGADLAEANL NNTCFKDCTL THLRTEDATM STSTQTLFNE 
FYSENI