Gene Phep_3037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3037
Symbol
ID	8254149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	3628346
End bp	3629560
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	41%
IMG OID	644936686
Product	cysteine desulfurase, SufS subfamily
Protein accession	YP_003093297
Protein GI	255532925
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0520] Selenocysteine lyase
TIGRFAM ID	[TIGR01979] cysteine desulfurases, SufS subfamily

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0138624
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTACTAA CGGATATAAG ACAGCAGTTC CCCATATTAT CGAGGATGGT GAAAGGTAAA 
CCACTGGTTT ATTTCGACAA TGCTGCTACC TCGCAAAAGC CGCAACAGGT AATTGATGCA 
TTGACGCATT ATTATTCGTT TTACAATGCC AATATACACC GCGGCATACA TACGCTTGCT 
GAAGAGGCGA CAATGGCTTA TGAAGCTACC CGTGAGGCTG TTAGGGATTT TGTTGGTGCA 
GATGCTACTG AAGAGATCAT TTTTACCAAA GGAACAACAG AGGCCATAAA CCTGGTTGCT 
TATACCTGGG GCAGACAAAA CATTACTGCA GGGGACGAGA TCATTATATC CGGCATGGAA 
CATCATTCGA ATATTGTTCC CTGGCAAATA CTATGTGAAG AGAAAAAGGC TTTCCTGAAA 
GTAATTCCTG TTACAGATGA GGGAGAACTT TCCATAGAAG CTTATAAAGA ATTACTGGGC 
TCGAAAACAA AACTGGTAGC TGTTGTTCAT GTATCTAATT CGTTGGGTAC CATAAATCAT 
GTGAACGAAA TTATCACTGC TGCACATCTT GTTGGTGCCA AAGTGCTGAT AGATGGGGCC 
CAATCTGCAG TCCACCTGGA TATCGATGTT CAGAAAATGG ATTGTGATTT TTTTGCTTTT 
TCCGGCCATA AGGTATATGG CCCTACAGGG GTTGGTGTAC TGTATGGTAA ACGCGAATTG 
TTGGAGGATA TGCCTGTTTT TCAAGGTGGT GGGGAAATGA TCAAAGATGT TACATTTGAG 
CAGACTACTT ATAATGACCT GCCTTATAAA TATGAAGCGG GTACACCAAA TATTGCAGAT 
ACAATTGCTT TAAAAACAGC ATTGGATTTT ATTACTGCAG TTGGAAAAGA TAAGATCAGG 
GTACATGAAG CTAATTTACT GGCCTACGCA ACAGCTCATT TAAAAACCAT TCCGGATTTG 
AGCATCATTG GCGAAGCCAA AGACAAAGCG GGTCTGGTGT CTTTTGTTGT TAAAGGTATA 
CATCCACAGG ATATTGGGGT ATTGCTCGAT AATATGGGTA TAGCTGTTAG AACAGGACAT 
CATTGTACGC AACCATTGAT GAAACGCTTT GGTATCCCTG GTACGGTAAG GGCATCCTTT 
GCAATGTATA ACCAACCGGA AGAAATAGAT GTGCTGATTA CCGGACTGCA CAAAACTATA 
AAAATGCTAA CGTAA

Protein sequence

MVLTDIRQQF PILSRMVKGK PLVYFDNAAT SQKPQQVIDA LTHYYSFYNA NIHRGIHTLA 
EEATMAYEAT REAVRDFVGA DATEEIIFTK GTTEAINLVA YTWGRQNITA GDEIIISGME 
HHSNIVPWQI LCEEKKAFLK VIPVTDEGEL SIEAYKELLG SKTKLVAVVH VSNSLGTINH 
VNEIITAAHL VGAKVLIDGA QSAVHLDIDV QKMDCDFFAF SGHKVYGPTG VGVLYGKREL 
LEDMPVFQGG GEMIKDVTFE QTTYNDLPYK YEAGTPNIAD TIALKTALDF ITAVGKDKIR 
VHEANLLAYA TAHLKTIPDL SIIGEAKDKA GLVSFVVKGI HPQDIGVLLD NMGIAVRTGH 
HCTQPLMKRF GIPGTVRASF AMYNQPEEID VLITGLHKTI KMLT