Gene Sfum_0400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_0400
Symbol
ID	4461423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	482019
End bp	483035
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	61%
IMG OID	639701155
Product	thymidylate synthase complementing protein ThyX
Protein accession	YP_844535
Protein GI	116747848
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1351] Predicted alternative thymidylate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTTC AATTCGTCAA AACCCGGGTG CAGCCCCAGG GAATCGCTCC GGCCGAAGAA 
GGCCGCGCCC TGCAGTTGGT CGAGCTCTGC GGCAGGACCG CGTACAAATC GGAAGACAAA 
ATCACTCCCG ATTCTGCGCG CAATTTCGTC CTGATGTTGA AGAGTCACGG TCACCTGTCC 
GTCCTGGAGC ACAGCAACAT CGTGCTGGAG ATCGAGGCGA CGCCGTCAAG CGGCGCTACA 
CAGGCCCTTT CTTCGATTTC CGAGCTCTAC GGGGCGCTGC TCGATGGCCT TGGCTTCCGA 
ACCGCCTACC ACCGCATCCA CCTCTCGGCC CGGACTTCCC CCGGCGCTCT TTTCATCGCC 
GGCAACCTGC GTTCCTGGAT CGAGACGCTC ACCCATCTGG GCAACGGCGG AAGCCCCCTC 
CACGCCCTCC TGTCCGCGGC TTTGCGCGAT TTCTTTCCCA TCATCTTCGG GGGCGAGGAA 
ACGGTTTCGA GCAACCTTTC CTTCAAGGTC ACCCTGGTCC GCGAAGACGA ACAACTGGCG 
CTGCTCCGGC GCGATGCCGC ATGCGATCTG CCCGTCTTCG TGTTCAAGTT CGTCTGCGAC 
CGCGGGATCA CTCACGAGGT GGTACGGCAC CGGGTGCTCT CGTTCACGCA GGAGAGCACC 
CGCTACGTGA ATTACAAGAA CAAGGGAATG GTGCTGATCC TTCCCGAAGA GCTCTATCCC 
TTTTACGACG ATGCGACGCA GCAGCTCACG GGCCGGTCGC CCCTCGTGGA CATGTGGATC 
GACAGGGCCG AGAAGCTCTT CGCCTGGTAC CGGGAAGACC TCGACCGGGA AAAACCGGAA 
ATTGCCCGGG ACATCCTCCC CAATCTGCTC AAGAGCGAAA TATTCGTGAG CGGCAGATGG 
AGCGGATGGA AGCACTTCGT TCAGCTGCGC GATTCCAAGC ACGCGCACCC GCGCATCCGG 
GCCATCGCCA AGGAAGTGAG GAACCACTTC GATTCCCTGG GAATGACCGT CGAGTAA

Protein sequence

MSVQFVKTRV QPQGIAPAEE GRALQLVELC GRTAYKSEDK ITPDSARNFV LMLKSHGHLS 
VLEHSNIVLE IEATPSSGAT QALSSISELY GALLDGLGFR TAYHRIHLSA RTSPGALFIA 
GNLRSWIETL THLGNGGSPL HALLSAALRD FFPIIFGGEE TVSSNLSFKV TLVREDEQLA 
LLRRDAACDL PVFVFKFVCD RGITHEVVRH RVLSFTQEST RYVNYKNKGM VLILPEELYP 
FYDDATQQLT GRSPLVDMWI DRAEKLFAWY REDLDREKPE IARDILPNLL KSEIFVSGRW 
SGWKHFVQLR DSKHAHPRIR AIAKEVRNHF DSLGMTVE