Gene SeHA_C2999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2999
Symbol
ID	6491370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	2939065
End bp	2940435
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	47%
IMG OID	642743155
Product	putative glycoporin
Protein accession	YP_002046779
Protein GI	194448709
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.419579
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.000157267
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGGCTA AATATTTGGC GCTGATGATC GGTGCTTGCT TTTCTCATAA CCTTTGGGCA 
GCGAATAATA TCACTATTGA GCAGCGTCTG GCTGAACTGG AGCAACGTGT TGTTAATGCT 
GAAAAACGGG CATCCGATGC CGAGGCGCAA ATTCGCTCGT TGAAACAGCA GCAGGTCGCC 
GCTACGCCGA TGGTGAATGT CCAGTCTGCC GAGCCCATTG CAGCAGGTAA AACACCGCCG 
AAGCTGACCT TATCCGGATT CAGCGATATT AAGTTCTATG GCGATGTCGA ATTTAATATG 
GATGCGGCAA GCCGTTCCGG TAGTCTGACA TCGACGAGAA CGTCAGCGAA TAAAGATTGG 
GCACCGGGAA CCAATGAACG CTGGGATATT AACGGACGCC TGTTGCTGGG CTTTGATGGC 
TACCAGCGGC TGGACAACGG TAATTTTGCC GGATTCTCTG TACAGCCTCT GGCGGACCTG 
ACCGGAAAAA TGAACCTTGA TGATGCCGTT TTCTTCTTTG GTCGTGAGAA TGACTGGAAA 
ATTAAGGTTG GTCGTTTTGA AGCCTACGAT ATGTTCCCAC TGAATCAGGA TACGTTTATT 
GAATATTCGG GGAATACAGC GAACGATCTT TACAGTGACG GTTACGGCTA TATCTATATG 
ATGAAAGAAG GACGGGGACG TAGCGACAGT GGGGGTAACT TCCTGCTGAG TAAAACCATC 
GACAACTGGT ATTTCGAAGT TAACACATTG CTGGAAAATG GCAGTACGTT ATATACCGAG 
AAGCAGTACC ACGGAATGGA TTTGAGCAAC GATAAAAATG TGGCTTACGT CCGTCCGGTT 
ATCGCCTGGC AAAACGGGCG TTTTTCAACG GCGATAGCGA TGGAAAGTAA CGTCGTTAAC 
AACGCCTATG GCTATTATGA GAATGGGAAG TGGATCGATC AGTCAGATCG TACGGGCTAT 
GGTTTTACCA TGACCTGGAA TGGTCAAAAA ACTGACCCGG AAGATGGCGC AGTGATTAAC 
CTGAATACCG CCTATATGGA TGCGACCGAT GAGACAGATT TTACCGCTGG GGTGAATGCG 
CTGTGGCATC GATTTGAACT GGGTTATATC TATGCGCATA ACAAAATCGA AGCCTTCAAT 
GCTACTAATA TCGATGCCGT TTGTGAGGAC GATTGCTGGA TCACCGATCC CGGCAATTAT 
GATATTCACA CTATTCATGC CTCATATTTA TTCCCCAACG TGATGGATAT GAAAAACTTT 
AACATCTACC TCGGTGCCTA TGCTTCATGG GTAGAGGCCA ATCCGAATAA TGGCGATAAC 
AGTGAAGATG CGCGTTACGG CGGGCGTCTG AGATTCAAAT ATTTCTTCTG A

Protein sequence

MKAKYLALMI GACFSHNLWA ANNITIEQRL AELEQRVVNA EKRASDAEAQ IRSLKQQQVA 
ATPMVNVQSA EPIAAGKTPP KLTLSGFSDI KFYGDVEFNM DAASRSGSLT STRTSANKDW 
APGTNERWDI NGRLLLGFDG YQRLDNGNFA GFSVQPLADL TGKMNLDDAV FFFGRENDWK 
IKVGRFEAYD MFPLNQDTFI EYSGNTANDL YSDGYGYIYM MKEGRGRSDS GGNFLLSKTI 
DNWYFEVNTL LENGSTLYTE KQYHGMDLSN DKNVAYVRPV IAWQNGRFST AIAMESNVVN 
NAYGYYENGK WIDQSDRTGY GFTMTWNGQK TDPEDGAVIN LNTAYMDATD ETDFTAGVNA 
LWHRFELGYI YAHNKIEAFN ATNIDAVCED DCWITDPGNY DIHTIHASYL FPNVMDMKNF 
NIYLGAYASW VEANPNNGDN SEDARYGGRL RFKYFF