Gene Ent638_3256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3256
Symbol
ID	5112970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	3548535
End bp	3549740
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	57%
IMG OID	640493460
Product	cysteine sulfinate desulfinase
Protein accession	YP_001177971
Protein GI	146312897
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily [TIGR03392] cysteine desulfurase, catalytic subunit CsdA

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCTT TCAGCCCTGC GCACTTTCGC GCGCAGTTTC CCGCGCTGGC CGATGCCGGT 
GTTTATCTTG ATAGTGCTGC CACGGCTTTA AAGCCGCTGG CCGTTATCGA GGCAACACAG 
GATTTTTATA GCCTGAGCGC CGGAAACGTC CATCGTAGCC AGTTTGCAGA AGCCCAGCGA 
TTGACCGCAC GTTACGAGGC CGCGCGCGAT CAGGTGGCTG AGTTGTTAAA TGCCGAAAGC 
GGTAAAAATA TCGTCTGGAC GCGCGGCACC ACAGAAGCCA TCAATATGGT CGCGCAATGC 
TACGCGCGCC CGCGCCTGCA GCCTGGTGAT GAAATTATTG TCAGCGAAGC AGAGCATCAC 
GCTAACCTGG TGCCGTGGCT CATGGTTGCA GAACAAACCG GCGCGCGTGT AGTTAAGCTC 
CCGCTGGGTG CAGATTTATT GCCAGATATT GCCTGCTTGC CTGACCTCAT CACCTCGCGC 
AGTCGGATTC TGGCGCTGGG GCAGATGTCT AACGTTACGG GGGGCTGCCC TGATCTCGCA 
CGTGCCATTG AGATTGCACA TGCGAACAAT GTTGTCGTGA TGGTCGACGG CGCACAGGGC 
GTGGTGCATT TTCCGGCTGA CGTGCAAAAA CTGGATATCG ACTTCTACGC CTTCTCCGCG 
CACAAACTCT ATGGCCCAAC GGGCATCGGC GCGTTGTATG GCAAAGCTGA ACTGTTGGCG 
CAAATGAGCC CATGGTTGGG CGGTGGCAAG ATGATCACCG AGGTGACTTT CGACGGATTT 
AAAACGCAAG AAATACCCTA TCGTCTGGAA GCCGGGACGC CAAACGTGGC GGGCGTGATT 
GGCTTGAGCG CCGCACTGGA ATGGCTGTCG CAAACCGACG TTGTGCAAGC AGAGAACTGG 
AGTCGCGGGC TGGCAACACT CGCTGAGGAA GAACTGAAAA AACGCCCTGG TTTTCGCTCT 
TTCCGAGTAC AGGATTCCAG CCTGCTGGCG TTTGATTTTG CCGGGGTACA TCATAGCGAT 
TTGGTGACTT TGCTCGCGGG TTACGGCATC GCATTACGCG CTGGACAACA TTGCGCCCAG 
CCGCTTCTCG CCGCGCTCGG CGTAGACGGA ACGCTTCGCG CTTCTTTTGC GCCTTACAAT 
ACGCAAAACG ACGTCGACGC CCTCGTTGCC GCCGTCGATC GTGCCCTTCA ACTTTTGGTG 
GATTAA

Protein sequence

MNAFSPAHFR AQFPALADAG VYLDSAATAL KPLAVIEATQ DFYSLSAGNV HRSQFAEAQR 
LTARYEAARD QVAELLNAES GKNIVWTRGT TEAINMVAQC YARPRLQPGD EIIVSEAEHH 
ANLVPWLMVA EQTGARVVKL PLGADLLPDI ACLPDLITSR SRILALGQMS NVTGGCPDLA 
RAIEIAHANN VVVMVDGAQG VVHFPADVQK LDIDFYAFSA HKLYGPTGIG ALYGKAELLA 
QMSPWLGGGK MITEVTFDGF KTQEIPYRLE AGTPNVAGVI GLSAALEWLS QTDVVQAENW 
SRGLATLAEE ELKKRPGFRS FRVQDSSLLA FDFAGVHHSD LVTLLAGYGI ALRAGQHCAQ 
PLLAALGVDG TLRASFAPYN TQNDVDALVA AVDRALQLLV D