Gene SeD_A2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2072
Symbol
ID	6875085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2005282
End bp	2006568
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	51%
IMG OID	642785185
Product	hypothetical protein
Protein accession	YP_002215851
Protein GI	198246165
COG category	[S] Function unknown
COG ID	[COG2718] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0000406999
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCTGGT TCATAGACCG ACGTCTTAAC GGCAAAAATA AAAGCACGGT GAATCGCCAG 
CGCTTTTTGC GCCGTTATAA AGCACAAATT AAGCAGTCAA TTTCCGAAGC GATTAATAAA 
CGCTCTGTGA CCGATGTCGA CAGCGGAGAG TCCGTCTCTA TTCCAACCGA TGATATTAGC 
GAACCGATGT TTCATCAGGG GCGCGGCGGT CTGCGCCATC GCGTCCATCC GGGTAACGAT 
CACTTTATCC AGAATGATCG CATTGAGCGT CCGCAAGGCG GTGGCGGCGG CGGTTCCGGC 
AGCGGTCAAG GTCAGGCCAG CCAGGACGGC GAAGGCCAGG ATGAGTTTGT TTTTCAGATT 
TCAAAAGATG AATATCTGGA TCTGCTCTTT GAAGATTTAG CGCTGCCTAA TCTGAAGAAA 
AACCAGCATC GCCAGCTTAA CGAGTATAAA ACTCACCGCG CCGGTTTCAC CTCAAACGGC 
GTACCGGCCA ATATCAGCGT GGTACGTTCG CTACAAAACT CTCTGGCGCG CCGTACAGCA 
ATGACGGCAG GAAAACGCCG CGAACTGCAC GCGCTGGAAA CGGAACTGGA GACCATCAGC 
CATAGCGAAC CAGCGCAACT GCTTGAAGAG GAGCGGTTAC GTCGGGAAAT TGCCGAACTA 
CGGGCTAAAA TCGAGCGAGT GCCGTTTATC GACACCTTTG ATTTACGCTA TAAAAATTAT 
GAAAAACGGC CTGAGCCCTC CAGCCAGGCG GTGATGTTCT GTCTGATGGA CGTCTCGGGT 
TCGATGGACC AGGCAACCAA AGATATGGCC AAGCGTTTTT ACATTCTGCT CTATCTGTTT 
TTGAGCCGAA CATATAAGAA CGTAGAAGTG GTTTATATCC GCCACCATAC CCAGGCGAAG 
GAAGTGGACG AACATGAGTT CTTTTATTCG CAAGAGACCG GGGGGACGAT TGTCTCCAGC 
GCGCTTAAAC TCATGGATGA AGTGGTTAAA GAGCGCTACG ACCCGGGGCA GTGGAACATC 
TATGCGGCGC AAGCGTCAGA CGGTGATAAC TGGGCCGACG ATTCACCGCT GTGTCATGAG 
ATTCTGGCGA AAAAGCTGCT GCCGGTAGTG CGCTATTACA GCTATATCGA GATTACCCGC 
CGCGCCCACC AGACCTTATG GCGCGAGTAT GAACATCTGC AGGCGACGTT CGATAACTTC 
GCCATGCAGC ATATTCGCGA TCAGGAGGAT ATTTATCCGG TATTCCGCGA ATTGTTTCAG 
AAACAGAGCG CCAATCAAAG CGTATAA

Protein sequence

MTWFIDRRLN GKNKSTVNRQ RFLRRYKAQI KQSISEAINK RSVTDVDSGE SVSIPTDDIS 
EPMFHQGRGG LRHRVHPGND HFIQNDRIER PQGGGGGGSG SGQGQASQDG EGQDEFVFQI 
SKDEYLDLLF EDLALPNLKK NQHRQLNEYK THRAGFTSNG VPANISVVRS LQNSLARRTA 
MTAGKRRELH ALETELETIS HSEPAQLLEE ERLRREIAEL RAKIERVPFI DTFDLRYKNY 
EKRPEPSSQA VMFCLMDVSG SMDQATKDMA KRFYILLYLF LSRTYKNVEV VYIRHHTQAK 
EVDEHEFFYS QETGGTIVSS ALKLMDEVVK ERYDPGQWNI YAAQASDGDN WADDSPLCHE 
ILAKKLLPVV RYYSYIEITR RAHQTLWREY EHLQATFDNF AMQHIRDQED IYPVFRELFQ 
KQSANQSV