Gene SeD_A1389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1389
Symbol
ID	6875060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1360455
End bp	1361453
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	53%
IMG OID	642784555
Product	hypothetical protein
Protein accession	YP_002215225
Protein GI	198244936
COG category	[S] Function unknown
COG ID	[COG3756] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1.16332e-16
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCGCAC TTCCATACAT GCAGCTTTAC ATCGCTGATT ATCTGGCGGA CACCATGCAC 
CTTTCTGCCG AGGAGCATGG AGCCTATTTG TTGTTGATGT TCAATTACTG GCAGACCGGA 
AGAGCTATCC CGAAAAACAG GCTGGCAAAA ATTGCTCGGA TTAGCAGTGA ACGATGGGGG 
GCTGTGGAAG AGTCCCTGAG AGAATTTTTC ATTGATAACG GCACTGAATG GACTCATGAG 
CGTATCGAAA ATGATCTCGC TGCGGTCAGG GATGTTCTGG CGAAAAAGTC GGCAGCAGGG 
AAAGCATCTG TTCAGTCCAG AAGGAACAGG AAGAAAACGC AGGCCGCCAG TGGAAGTAAC 
ACATGTTCAA CAGGTGTTGG TTCGGTGTTT AAACAGGAAG CCAACAAAAA GGGAACTAAT 
AAAGATATAG ATCTAAAAGA ATTAAACCCC ACACATAACG CGTGCGCGCG CGCGAGTGCT 
CCGGTTAGTC AGCCTGGAAT TATGCAACAG CCTGTCGTGA CTGAACCGGA ATACCTGAAC 
GAGCCGATCG GGAAATTCTC AATGATGGAT GACTGGCATC CCTCGCTGGA TTTCCGACAA 
CGGGCCGCCC ATTGGGGCGT TGCGTTACCA GAGCCGGAGT ATTTACCTAC GGAGCTTGTC 
GCGTTCAGGG ATTACTGGAC GTCGGAGGGA AAGGTGTTCA CACAAATCCA GTGGGAACAA 
AAATTCGCCC GTCACGTAAA CCACGTCAGG GCAAAGGCGA AACCAGCCAG CAGGGGAGAA 
AGCCATGCAG AAATCCAGCC AGACAGCACC GCATCGCGGG CAGTACAGCA AATCAGGGCA 
GCCCGCGTGC AGTGGGAACG CGAAAACGGG ATCGCCAGCG ACGGAGACGG CCTGGCGACT 
CTGGGAAGTC ATGGGGGAAA TTTATTCGAA CCGATGGACG CAGAAGAACG GCGCGGCACC 
TTCGAAGCTG TGGGTGGCCC AGATTGGGGC GATGACTGA

Protein sequence

MAALPYMQLY IADYLADTMH LSAEEHGAYL LLMFNYWQTG RAIPKNRLAK IARISSERWG 
AVEESLREFF IDNGTEWTHE RIENDLAAVR DVLAKKSAAG KASVQSRRNR KKTQAASGSN 
TCSTGVGSVF KQEANKKGTN KDIDLKELNP THNACARASA PVSQPGIMQQ PVVTEPEYLN 
EPIGKFSMMD DWHPSLDFRQ RAAHWGVALP EPEYLPTELV AFRDYWTSEG KVFTQIQWEQ 
KFARHVNHVR AKAKPASRGE SHAEIQPDST ASRAVQQIRA ARVQWERENG IASDGDGLAT 
LGSHGGNLFE PMDAEERRGT FEAVGGPDWG DD