Gene SeD_A4795 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4795
Symbol
ID	6874487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	4649137
End bp	4650276
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	50%
IMG OID	642787686
Product	hypothetical protein
Protein accession	YP_002218280
Protein GI	198243435
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTC GACGCTGGAT TTTAAGCGCT ACGCTTTTGC TGCTGCCTGT TCCTGCGTTC 
GCAGATTTTC AGTATCAGCA GGATAAGGAC GGCGTTTTTT ATACCGCCGA CGACGAACCG 
CAAATTCTCT CCCGACTGCC TGACGTTAGC TATTCGCATT TACGGCGTAT TGCCGATTTA 
TCTCACCCGC AAGACCCTCG CCCGTTAATA GAAATCAATC CCGACAGCCA TAACTGCGAC 
GACAATCATA TTTGTCAGCA CGCTTATCTC AGCGATGGGC GCTTTATCCT GTGGGCAGGC 
AAAATCGTCC AGAATACCGG GGATGAGCCT GCCGTTGATG TTGCCAGCTT TCAGTCTTTT 
GGCGCCTTTG CCGCCGATAA ACACGGTCTC TATTTTGATG GTAAACGTCG TGATAGCAAT 
GCGGGTGAAA AACGTGTGGA TATGGCGACT CTGGCAGAGA CGAAAATCTG GAATCTGCTG 
CGGGATAAAA ATAATCTCTA TTATGAAGGC CGCTGGCTGG GGCGGGCCGA TGGGTTTCGC 
GTGTTGAGGC TGGATTCCAC TTCGGCAAGG GAGTTTATTG TGACGACGGC GCAACGGGTG 
ATTGTGAACG GCATACCCAT TACCGCTGAT GCTAATACGT TTCAAATCAT TCGCTGGATG 
CCTGGCGAGG TACTAATTTA TCGTGATAAA ACCGGTAAGC ATGACTATGA GATTGATAAT 
TCCAGTCGGT ACTGCGGCTA TTTTAATATT GGCCTGCGTG AGGTGACATG GCTGAAACAT 
GAGGCAACCA ACGCCGGGAG CAGTTGTAAA GTGGAAACCC TGCCGGGTGT CGATCCGGAG 
TATTTTTTTC GTCTGAACGG GAACACCGGT TGGTATAAGG ATCGTATTTA TCAGGTGAGC 
ACGAATGCGT TGGGCGAGGG GGTACTGCGC ATTTTTACGT CGCAGGAAAA ACTTCCGGCG 
CTGAAAATAG ATAGAGTTAC CTATAATTAC TACCATCTGG CTTTGTCCGC GGATGGGCAA 
TTATATCGCC AGATCTCACG TGATCAATGG CAGCGCTATA ACCCGATATT AACAGAGTGG 
ACGACGGTAT CACCAGCGCC CACTGACGTT ATCTCTTTGC TTCCCTCTGA TTACCACTAG

Protein sequence

MTIRRWILSA TLLLLPVPAF ADFQYQQDKD GVFYTADDEP QILSRLPDVS YSHLRRIADL 
SHPQDPRPLI EINPDSHNCD DNHICQHAYL SDGRFILWAG KIVQNTGDEP AVDVASFQSF 
GAFAADKHGL YFDGKRRDSN AGEKRVDMAT LAETKIWNLL RDKNNLYYEG RWLGRADGFR 
VLRLDSTSAR EFIVTTAQRV IVNGIPITAD ANTFQIIRWM PGEVLIYRDK TGKHDYEIDN 
SSRYCGYFNI GLREVTWLKH EATNAGSSCK VETLPGVDPE YFFRLNGNTG WYKDRIYQVS 
TNALGEGVLR IFTSQEKLPA LKIDRVTYNY YHLALSADGQ LYRQISRDQW QRYNPILTEW 
TTVSPAPTDV ISLLPSDYH