Gene Gobs_1000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_1000
Symbol
ID	8752661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	-
Start bp	1059099
End bp	1060517
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	71%
IMG OID
Product	fumarate lyase
Protein accession	YP_003408132
Protein GI	284989578
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCGCTG AGACCCAGGC CGCACAGCAG GACGGCACCG ACTACCGCAT CGAGCACGAC 
TCCATGGGCG AGGTCCGGGT CCCCGCGTGG GCGAAGTGGC GGGCGCAGAC CCAGCGCGCC 
GTCGAGAACT TCCCGATCTC CGGCACGCCG ATCGAGCGGG AGCTGATCGG CGCCCTTGCC 
GCGATCAAGG GTGCCGCTGC CGCGGTGAAC GCCTCCCTGG GTGTGCTGCC GCAGGAAACC 
GCCGACGCGA TCGGCACCGC GGCCGCGTCC GTGGCCCGCG GCGAGTGGGA CGAGCACTTC 
CCCATCGACG TCTTCCAGAC GGGGTCGGGG ACGTCGAGCA ACATGAACAC CAACGAGGTG 
ATCGCCTCCC TCGCCACCGA GGCGCTCGGC TCGCCGGTGC ACCCCAACGA CCACGTCAAC 
GCCTCGCAGT CGTCCAACGA CGTCTTCCCG TCGGCCATCC ACGTGGCCGC GACGCGGGCG 
ATCGTCCGCG ACCTGATCCC GGCGCTGCAG CACCTCGAGG CCTCGCTCTC CCGCAAGGCC 
GAGGAGTTCG CCGAGGTCGT GAAGAGCGGC CGCACCCACC TGATGGACGC CACCCCGGTC 
ACCCTCGGCC AGGAGTTCGG CGGGTACGCC GCGGCGGTGC GCTACGGCGT CGAGCGGCTG 
CAGGCGTCGC TGCCGAGGAT CGGCGAGCTG CCGTTGGGCG GCACCGCGGT CGGCACGGGC 
ATCAACACCC CGCCCGGGTT CGCCGCCGCG ATCATCGAGC GGCTCGCCGC CGAGCTGGAC 
CTGCCGCTCT CCGAGGCGCG CGACCACTTC GAGGCGCAGA GCTCGCGCGA CGCCCTGGTG 
GAGGGCTCCG GCCAGCTGAA GACGATCGCC GTCGGCCTGG TGAAGATCGC CAACGACCTG 
CGCTGGATGG GTTCCGGCCC GCGCACCGGC CTGGGCGAGA TCCAGCTGCC CGACCTGCAG 
CCCGGCAGCT CGATCATGCC GGGCAAGGTG AACCCGGTGA TCCCGGAGGC GGTCATCCAG 
GTGAGCGCGC AGGTGATCGG GAACGACGCC GCGGTGACCT TCGCCGGCAC CACCGGCGTC 
TTCGAGCTCA ACGTCACGCT GCCCCTGATG GCCCGCAACG TGCTCGAGTC CATCCGGCTG 
CTGGCCAACG CCAGCCGGAT CCTGGCCGAC CGCTGCGTCG ACGGGATCGT CGCCAACGTC 
GACCGGTGCC GGGAGTACGC CGAGTCCTCG CCGTCGATCG TGACGCCGCT GAACAAGTAC 
ATCGGCTACG AGGAGGCGGC CAAGGTCGCC AAGCAGTCGC TGGCCGAGCA GAAGACGATC 
CGCCAGGTCG TGGTGGAGCG GGGCTACGTC GAGCAGGGCA AGCTCACCGA GCAGCAGCTC 
GACGAGGCCC TCGACGTCCT CTCGATGACC CACCCGTGA

Protein sequence

MPAETQAAQQ DGTDYRIEHD SMGEVRVPAW AKWRAQTQRA VENFPISGTP IERELIGALA 
AIKGAAAAVN ASLGVLPQET ADAIGTAAAS VARGEWDEHF PIDVFQTGSG TSSNMNTNEV 
IASLATEALG SPVHPNDHVN ASQSSNDVFP SAIHVAATRA IVRDLIPALQ HLEASLSRKA 
EEFAEVVKSG RTHLMDATPV TLGQEFGGYA AAVRYGVERL QASLPRIGEL PLGGTAVGTG 
INTPPGFAAA IIERLAAELD LPLSEARDHF EAQSSRDALV EGSGQLKTIA VGLVKIANDL 
RWMGSGPRTG LGEIQLPDLQ PGSSIMPGKV NPVIPEAVIQ VSAQVIGNDA AVTFAGTTGV 
FELNVTLPLM ARNVLESIRL LANASRILAD RCVDGIVANV DRCREYAESS PSIVTPLNKY 
IGYEEAAKVA KQSLAEQKTI RQVVVERGYV EQGKLTEQQL DEALDVLSMT HP