Gene Shewmr4_3131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewmr4_3131
Symbol
ID	4253702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. MR-4
Kingdom	Bacteria
Replicon accession	NC_008321
Strand	+
Start bp	3749418
End bp	3750665
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	53%
IMG OID	638119773
Product	cysteine desulfurase
Protein accession	YP_735259
Protein GI	113971466
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACATT CAGCCTCAAC CGACACAACA TTGCCCGATA GCCATAGCCA AATCCGCTCG 
CAATTTCCAA CCCTCTCGCA AATGTTGGGC GACTATCCCC TGTGTTATCT CGATACCGCG 
GCCACCAGCC AAAAGCCGCA ATCCGTGTTA GATGCCATGG CTCAGTATTA CCTGAACGAC 
AATGCCAATG TGCACCGTGC GGCGCACCAG TTATCGGCGC GCGCGACCTC TAGCTACGAG 
AAAGTCCGCG ATGAGTTACA AGGGTTTATT AATGCAAAGC GCCGCGAAGA AATCATCTTC 
ACCCACGGCA CCACAGAGTC GATCAATCTA GTCGCCTATG GCTTAACGCC ACAGATTGCT 
GCGGGCGATC TGATTTTGAT CGATACCGCC GCCCACCACG CCAACATAGT GCCATGGCAA 
GAATTGGCAA AACGCACGGG CGCCATCATT AAACCTATCC CTCTCGATCG TGATGGCAGG 
CTCGATCGCC ATGCCTATCA AGCGCTGCTC GCCCTCAAGC CCAAAGTAGT CGCCCTGTGC 
CATGTTTCTA ATGCCTTAGG CACAGTGAAT CCTGTTGTCG AATTAGTGCA GCAAGCCAAG 
GCACAAGGGG CGATCACCTT AGTCGATGGG GCGCAGGCGG TTGCACACTT AAGCTTAGAT 
ATGGCCGCTA TCGATTGTGA TTTTTATGTG TTTTCCGGCC ATAAGATGTA TGGCCCGACT 
GGCATTGGTG TGCTTTATGG CCGCTTCGAT AAGTTAGATA CGCTCACGCC ACTGTTAACG 
GGCGGTGAGA TGATTAAACG AGTGAGTTTC GATGGCACCG AATTTGGCAG CCTACCCAAT 
CGCTTAGAAG CGGGTACACC ACCCATCAGT GAAGTCATCG GCCTAGGCGC CGCTATCCGC 
TTTTTGCAAC AACACTTAAC GCCAGAGGTT CAGGCCCACG AGGCTGAGCT GCTGCAGTAT 
TTACAGCACC AGCTGCGCGC CCTCGGAGAT GTGCATCTCT ATGCTGCCCA TAGTGATAAT 
CTCGGTGCGG TTGCCTTTAA TCTGGGCGAT GAACACCATC AAGATGTCGG GATTTTATTA 
GATCAACAAG GCGTTGCCGT GCGCTGCGGT CATCACTGCG CCATGCCCTT GATGCAAAGC 
CTTAACCTGA AGGGCTGCTG CCGAGCATCG ATTGGTATCT ACACCAATAA AGCCGATATC 
GACCGCTTTA TTGCCGCCTT AGCCTCAGTC AAAGAGTTGC TGCTCTAA

Protein sequence

MTHSASTDTT LPDSHSQIRS QFPTLSQMLG DYPLCYLDTA ATSQKPQSVL DAMAQYYLND 
NANVHRAAHQ LSARATSSYE KVRDELQGFI NAKRREEIIF THGTTESINL VAYGLTPQIA 
AGDLILIDTA AHHANIVPWQ ELAKRTGAII KPIPLDRDGR LDRHAYQALL ALKPKVVALC 
HVSNALGTVN PVVELVQQAK AQGAITLVDG AQAVAHLSLD MAAIDCDFYV FSGHKMYGPT 
GIGVLYGRFD KLDTLTPLLT GGEMIKRVSF DGTEFGSLPN RLEAGTPPIS EVIGLGAAIR 
FLQQHLTPEV QAHEAELLQY LQHQLRALGD VHLYAAHSDN LGAVAFNLGD EHHQDVGILL 
DQQGVAVRCG HHCAMPLMQS LNLKGCCRAS IGIYTNKADI DRFIAALASV KELLL