Gene SeHA_C3559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3559
Symbol
ID	6491843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3449997
End bp	3452039
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	59%
IMG OID	642743682
Product	LppC superfamily
Protein accession	YP_002047296
Protein GI	194449109
COG category	[R] General function prediction only
COG ID	[COG3107] Putative lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	92
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACCCT CAACATTTTC TCGTTTGAAC GCCGCGCGCG CGCTGCCTGT CGTCCTGGCT 
GCGCTACTTT TCGCCGGGTG CGGCACCCAG GCGCCAGATC AAAGCGCAGC CTATATGCAG 
GGTTCAGCGC AAGCTGACTC CGCCTTTTAC CTGCATCAGA TGCAGCAAAG CGCAGATGAT 
AGCAAGACCA ACTGGCAATT ACTCGCCATT CATGCACTGC TGAAAGAAGG AAAAAGCCAG 
CAGGCCGTCG ACCTGTTCAA CCAACTCCCG CAAAATCTGA ACGATACCCA GCGTCGCGAA 
CAGTCTTTAT TAGCGGTAGA AATCAAACTG GCGCAAAAAG ATGTCGCAGG CGCGCAGGCC 
TTGCTGGATA AACTAAAACC CGCCGACTTT GCGCCACATC AGCAAGCGCG TTACTGGCAG 
GCGCAGATCG TTGCCAGCCA GGGACGCCCG TCGCTTACCC TGTTGCGGGC GTTAATCGCC 
CAGGAACCGC TACTGGCGGC GAAAGATAAA CAAAAAAATA TCGACGCCAC CTGGCAGGCG 
CTCTCCGCCA TGACGCCGGA TCAGGCCAGG ACGCTGGTTA TCAACGCCGA TGAAAATGTG 
CTTCAGGGCT GGCTGGATCT GCAACGCGTC TGGTTTGACA ACCGCAACGA TCCGGACATG 
CTGAAAGCCG GGATCGCCGA CTGGCAAAAA CGCTACCCGC AAAATCCGGG GGCGAAAATG 
CTGCCGACGC AGCTCGTCAA TGTACAACGT TTCAAACCGG CTTCCACCAG CAAAATCGCT 
CTGCTGCTGC CGCTGAACGG TCAGGCTGCC GTGTTTGGCC GTACCATCCA GCAAGGTTTC 
GAAGCCGCGA AAAACCTCGG CACCCAGGCG GTAGAGATGC AGCCTGCCGC CGCGCCTGAC 
GCGCCGGTAG AACCTGGCGT GGAGGAGACG CAGCCACAAA TGACCAACGG CGTCGCCAGT 
CCGTCGCAGG CCTCGGTGAG CGATCTGACT GATGACGCTC CATCCCAGTC CGCTACGCCA 
GTCAGCGCGC CACAAACTCC CCCTGCTACA GCAAGCGCGC CAGCGGATCC CTCCGCTGAA 
TTAAAAATCT ACGATACCTC TTCCCAGCCG TTGGATCAGG TGCTTGCTCA GGTTCAGCAA 
GACGGCGCCA GTATCGTGGT CGGGCCGCTG TTGAAAAACA ATGTGGAAGC GCTGATGAAA 
AGCAACACGC CGCTCAACGT GCTGGCGCTC AACCAGCCGG AAACGGTACG TAGCTTCCCT 
AATATCTGCT ATTTCGCGCT CTCTCCAGAA GATGAAGCCC GTGATGCGGC GCATCATATT 
TATGACCAGG GCAAGCAGTC GCCGCTGCTG TTGATCCCAC GCAGCACGCT TGGCGATCGC 
GTGGCGAACG CCTTCACCCA AGAGTGGCAA AAACTGGGCG GCGGCATCGT GTTACAGCAA 
AAATTCGGCT CCGTAGCCGA GCTGAAAATG GGCGTGAACG GCGGCGCGGG TATCGCGTTG 
ACGGGCAGCC CGGTCGCCGC CAGCGTGCCT GCGCAGCCTG GCGTCACCAT TGGCGGTCTG 
ACTATCCCTG CGCCGCCGAC CGACGCGCAA ATCACCGGCG GCGGACGCGT AGACGCGGTC 
TATATTCTGG CTACGCCGGA AGAGATTGGC TTTATCAAAC CGATGATCGC CATGCGTAAC 
GGCACCCAGA GCGGCGCGAC GCTGTATGCC AGCTCTCGCA GCGCGCAAGG CACCTCCGGC 
CCTGACTTCC GTCTGGAGAT GGAAGGTTTG CAATACAGTG AAATTCCCAT GCTGGCAGGC 
GGCAATATGC CGTTGATGCA GCAGGCGCTG AGCGCTGTAC ATAACGACTA TTCTCTGGCG 
CGGATGTACG CCATGGGCGT GGATGCCTGG ACGCTGGCGA ACCACTTTTC GCAGATGCGT 
CAGGTGCAGG GGTTTGAGAT CAATGGTAAT ACCGGCGCAT TAACCGCCAG CCCGGATTGT 
GTGATTAACA GGAAGTTATC ATGGCTCAAA TACCAGCAAG GGGAGATTGT TCCCGCCAGC 
TAA

Protein sequence

MVPSTFSRLN AARALPVVLA ALLFAGCGTQ APDQSAAYMQ GSAQADSAFY LHQMQQSADD 
SKTNWQLLAI HALLKEGKSQ QAVDLFNQLP QNLNDTQRRE QSLLAVEIKL AQKDVAGAQA 
LLDKLKPADF APHQQARYWQ AQIVASQGRP SLTLLRALIA QEPLLAAKDK QKNIDATWQA 
LSAMTPDQAR TLVINADENV LQGWLDLQRV WFDNRNDPDM LKAGIADWQK RYPQNPGAKM 
LPTQLVNVQR FKPASTSKIA LLLPLNGQAA VFGRTIQQGF EAAKNLGTQA VEMQPAAAPD 
APVEPGVEET QPQMTNGVAS PSQASVSDLT DDAPSQSATP VSAPQTPPAT ASAPADPSAE 
LKIYDTSSQP LDQVLAQVQQ DGASIVVGPL LKNNVEALMK SNTPLNVLAL NQPETVRSFP 
NICYFALSPE DEARDAAHHI YDQGKQSPLL LIPRSTLGDR VANAFTQEWQ KLGGGIVLQQ 
KFGSVAELKM GVNGGAGIAL TGSPVAASVP AQPGVTIGGL TIPAPPTDAQ ITGGGRVDAV 
YILATPEEIG FIKPMIAMRN GTQSGATLYA SSRSAQGTSG PDFRLEMEGL QYSEIPMLAG 
GNMPLMQQAL SAVHNDYSLA RMYAMGVDAW TLANHFSQMR QVQGFEINGN TGALTASPDC 
VINRKLSWLK YQQGEIVPAS