Gene Ent638_3027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3027
Symbol
ID	5111736
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	3294168
End bp	3295382
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	54%
IMG OID	640493221
Product	cysteine desulfurase
Protein accession	YP_001177742
Protein GI	146312668
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR02006] cysteine desulfurase IscS [TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0576674
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTAC CGATCTATCT CGACTACTCC GCAACCACGC CGGTGGACCC GCGTGTTGCC 
GAGAAAATGA TGCAGTGTCT GACCCTGGAC GGAAACTTTG GTAACCCAGC TTCCCGTTCT 
CACCGTTTTG GCTGGCATGC TGAAGAGGCG GTTGATATCG CCCGTAATCA GATTGCTGAG 
CTGGTGGGTG CCGATCCGCG TGAAATTGTT TTCACCTCCG GCGCTACCGA ATCCGATAAC 
CTGGCGATAA AAGGCGCGGC CAACTTCTAT CAGAAGAAAG GCAAGCACAT TATTACCAGC 
AAAACCGAAC ACAAAGCCGT GCTGGATACC TGTCGTCAGC TGGAACGTGA AGGGTTTGAC 
GTCACTTACC TTGCGCCAAA AAGCAACGGT ATCATCGACC TCAAAGAGCT CGAAGCGGCC 
ATGCGTGATG ACACCATTCT GGTTTCAATC ATGCACGTGA ACAACGAAAT CGGCGTGGTT 
CAGGATATCG CGACTATCGG CGAAATGTGC CGTGCGCGCG GCATCATCTA TCACGTGGAC 
GCCACCCAGA GCGTGGGCAA ACTGCCTATC GACCTGAGCC AGCTGAAAGT AGATCTGATG 
TCCTTCACCG GCCACAAGAT CTACGGACCG AAAGGTATCG GCGCGCTGTA CGTTCGTCGT 
AAACCCCGTA TCCGCATCGA AGCACAGATG CACGGCGGCG GTCACGAGCG CGGCATGCGT 
TCAGGGACTC TGCCTGTTCA CCAGATCGTG GGAATGGGTG AAGCCTACCG TATCGCGAAA 
GAAGAGATGG AAACCGAGAT GGCGCGCCTG CGCACGCTGC GTAACCGTCT TTGGGACGGC 
GTGAAGGACA TGGAAGAAGT GTACCTGAAC GGCGATCTCG AGCAGGGCGT GCCAAATATT 
CTCAACGTCA GCTTCAACTA TGTTGAAGGC GAGTCGCTGA TTATGGCGCT GAAAGACCTG 
GCCGTTTCTT CGGGTTCTGC CTGTACGTCT GCAAGCCTCG AGCCATCCTA CGTGCTGCGC 
GCACTGGGCA TGACCGACGA GCTGGCACAC AGTTCTATCC GTTTCTCTTT AGGTCGTTTC 
ACTACCGAAG AAGAGATTGA CTACACCATC AAGCTCGTTC GCAACTCCAT TGGCCGTCTG 
CGCGACCTTT CTCCACTGTG GGAAATGTTC AAACAGGGCG TGGATATCAA CAGCATCGAA 
TGGTCACATC ACTAA

Protein sequence

MKLPIYLDYS ATTPVDPRVA EKMMQCLTLD GNFGNPASRS HRFGWHAEEA VDIARNQIAE 
LVGADPREIV FTSGATESDN LAIKGAANFY QKKGKHIITS KTEHKAVLDT CRQLEREGFD 
VTYLAPKSNG IIDLKELEAA MRDDTILVSI MHVNNEIGVV QDIATIGEMC RARGIIYHVD 
ATQSVGKLPI DLSQLKVDLM SFTGHKIYGP KGIGALYVRR KPRIRIEAQM HGGGHERGMR 
SGTLPVHQIV GMGEAYRIAK EEMETEMARL RTLRNRLWDG VKDMEEVYLN GDLEQGVPNI 
LNVSFNYVEG ESLIMALKDL AVSSGSACTS ASLEPSYVLR ALGMTDELAH SSIRFSLGRF 
TTEEEIDYTI KLVRNSIGRL RDLSPLWEMF KQGVDINSIE WSHH