Gene SNSL254_A3858 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3858
Symbol
ID	6486009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3731624
End bp	3732820
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	57%
IMG OID	642739123
Product	hypothetical protein
Protein accession	YP_002042834
Protein GI	194446673
COG category	[R] General function prediction only
COG ID	[COG2081] Predicted flavoproteins
TIGRFAM ID	[TIGR00275] flavoprotein, HI0933 family

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00469108
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	92
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAAGGT TTGATGCCGT TATTATAGGC GCTGGCGCAG CGGGCATGTT TTGCGCCGCG 
CAGGCAGGAC AGGCGGGTAG CCGCGTGCTG CTCATCGATA ATGGCAAGAA GCCAGGACGT 
AAAATCCTCA TGTCCGGCGG TGGGCGCTGC AACTTTACTA ATCTTTATGT TGAGCCTGCT 
GCGTATTTGA GCCAGAACCC CCATTTTTGT AAATCAGCGT TAGCCCGCTA TACCCAGTGG 
GATTTTATCG ATCTGGTCGA CAGGTATGGG ATAGCCTGGC ATGAGAAAAC GCTGGGACAG 
CTTTTTTGCG ATGATTCCGC CCAACGCATT GTCGATATGC TGGTTGCCGA GTGCGACAAA 
GGCGGCGTAA CGATGCGCCT GCGTAGCGAG GTACTGAGCG TCGAGCGTGA TGAGTCGGGT 
TTCATACTGG CGTTGAACGG CGAGACGGTG ACTACGCAAA AGCTGGTGAT TGCCAGCGGC 
GGCCTGTCGA TGCCGGGGCT TGGCGCATCG CCGTTTGGCT ATAAAATCGC CGAACAGTTT 
GGTCTCAAGG TGTTGCCGAC GCGCGCCGGG CTGGTGCCCT TTACGCTGCA TAAGCCGCTG 
TTAGAACAGC TCCAGACGCT GTCTGGCGTC TCTGTGCCCT GCGTGATTAC CGCCCGCAAT 
GGTACGGTAT TTCGGGAAAA CCTACTTTTT ACCCATCGTG GGCTGTCCGG CCCCGCCGTT 
TTACAGATTT CCAGCTACTG GCAACCGGGC GAGTTAGTGA GCATTAACTT ATTGCCGGAT 
CTCTCGCTGG AAGACGTTCT CAATGAACAG CGTAACGCGC ACCCGAACCA GAGTCTGAAG 
AACACGCTGG CGATGCATCT GCCGAAACGG TTGGTGGAGT GTTTACAACA GTTGGGGCAG 
ATCCCGGATG TATCGCTCAG GCAGTTGAAC GTTCGTGACC AGCAGGCGTT GGTTGACACG 
CTTACGGCCT GGCAAGTGCA GCCTAACGGC ACCGAAGGCT ATCGGACAGC GGAAGTGACG 
CTGGGCGGCG TGGATACAAA CGAACTATCA TCGCGGACTA TGGAAGCGCG CCGCGTGCCG 
GGTCTCTATT TTATTGGCGA AGTGATGGAC GTCACCGGCT GGTTGGGCGG CTATAACTTC 
CAGTGGGCCT GGTCGAGCGC CTGGGCCTGC GCGCAGGATT TGGCGGCAAA ACGCTAA

Protein sequence

MERFDAVIIG AGAAGMFCAA QAGQAGSRVL LIDNGKKPGR KILMSGGGRC NFTNLYVEPA 
AYLSQNPHFC KSALARYTQW DFIDLVDRYG IAWHEKTLGQ LFCDDSAQRI VDMLVAECDK 
GGVTMRLRSE VLSVERDESG FILALNGETV TTQKLVIASG GLSMPGLGAS PFGYKIAEQF 
GLKVLPTRAG LVPFTLHKPL LEQLQTLSGV SVPCVITARN GTVFRENLLF THRGLSGPAV 
LQISSYWQPG ELVSINLLPD LSLEDVLNEQ RNAHPNQSLK NTLAMHLPKR LVECLQQLGQ 
IPDVSLRQLN VRDQQALVDT LTAWQVQPNG TEGYRTAEVT LGGVDTNELS SRTMEARRVP 
GLYFIGEVMD VTGWLGGYNF QWAWSSAWAC AQDLAAKR