Gene SNSL254_A4717 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4717
Symbol
ID	6486997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4596406
End bp	4597560
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	55%
IMG OID	642739932
Product	putative iron-sulfur cluster binding protein
Protein accession	YP_002043610
Protein GI	194442339
COG category	[C] Energy production and conversion
COG ID	[COG1600] Uncharacterized Fe-S protein
TIGRFAM ID	[TIGR00276] iron-sulfur cluster binding protein, putative

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000105537
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTATGGT CCATCATGTC AAAGCCCCTC GATCTCAATC AGTTAGCGCA AAATATTAAG 
CAGTGGGGGC TGGAGCTGGG CTTTCAGCAG GTCGGTATTA CTGATACCGA TCTGCGCGCA 
TCCGAACCTG CGCTGCAGGC GTGGCTGGAC AAACAATACC ACGGCGAGAT GGCATGGATG 
GCGCGCCACG GTATGATGCG CGCCCGGCCT CATGAACTCT TACCCGGTAC GCTACGTGTC 
ATCAGCGTGC GCATGAACTA TTTGCCCGCC AACGCCGCGT TTGCCAGTAC GTTGAAGGAT 
CCCACGCTGG GCTACGTTAG CCGATATGCG CTGGGGCGTG ATTATCACAA GCTGTTACGC 
AGCCGCCTTA AAAAACTGGG CGAGCAGATC CAGCAGTACT GCGGTTCGCT GAATTTTAGA 
CCGTTTGTCG ACTCTGCGCC TATTCTTGAA CGCCCATTAG CGGAAAAAGC CGGACTTGGC 
TGGACGGGTA AGCACTCACT TATCCTTAAT CGGGAGGCGG GCTCATTCTT TTTCCTGGGG 
GAATTGCTGA TTGATTTACC GCTGCCGGTC GACCAGCCGG TCGAGGAAGG TTGCGGCAAA 
TGCGTCGCCT GTATGACCAT TTGCCCGACC GGGGCGATTG TCGAACCGTA TACGGTGGAC 
GCGCGGCGCT GTATTTCTTA TCTCACCATT GAGCTGGAAG GCGCTATTCC GGAAGCATTT 
CGCCCACTGA TAGGCAACCG TATTTACGGC TGCGATGACT GCCAGCTTAT CTGTCCGTGG 
AATCGTTACT CTCAGTTGAC CGACGAAGCA GATTTTAGCC CACGCAAGGC GCTGCATAAC 
CCAGATTTGC TTGAGTTGTT TAGCTGGAGC GAAGCGCAGT TTCTGAAAGT CACTGAAGGT 
TCTGCGATTC GGCGCATTGG TCATTTACGC TGGCTGCGCA ATGTTGCCGT CGCGCTGGGG 
AATGCGCCGT GGAGTAATGC CGTCATTACG GCGCTGGAAA GCCGCAAGGG TGAGCATCCA 
CTTCTCGATG AGCATATCGA ATGGGCGATT GCGCAACAAA TTGAAAAGCG CAACGCCTGC 
ATCATTGAAG TGCAGCTACC GAAAAAACAG CGTCTGGTCA GGGTGATTGA AAAAGGGCTG 
GTGCGCGATG CCTGA

Protein sequence

MLWSIMSKPL DLNQLAQNIK QWGLELGFQQ VGITDTDLRA SEPALQAWLD KQYHGEMAWM 
ARHGMMRARP HELLPGTLRV ISVRMNYLPA NAAFASTLKD PTLGYVSRYA LGRDYHKLLR 
SRLKKLGEQI QQYCGSLNFR PFVDSAPILE RPLAEKAGLG WTGKHSLILN REAGSFFFLG 
ELLIDLPLPV DQPVEEGCGK CVACMTICPT GAIVEPYTVD ARRCISYLTI ELEGAIPEAF 
RPLIGNRIYG CDDCQLICPW NRYSQLTDEA DFSPRKALHN PDLLELFSWS EAQFLKVTEG 
SAIRRIGHLR WLRNVAVALG NAPWSNAVIT ALESRKGEHP LLDEHIEWAI AQQIEKRNAC 
IIEVQLPKKQ RLVRVIEKGL VRDA