Gene Anae109_3952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_3952
Symbol
ID	5378296
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	4612393
End bp	4613664
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	75%
IMG OID	640845476
Product	CBS domain-containing protein
Protein accession	YP_001381114
Protein GI	153006789
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.173559
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCCTT CGATCCGTCA CTTCCTCGTG CTCGCAGCCT CCGCCGCGGC GCTCCTCGCG 
GTGCGGGCCC TGGTGGCCGC CCTGGAGGCG GCGCTCGTCG CCGTGGGCAC TCCCCGCGCG 
CAGGAGCTCG CGGCGGATCC GTCGGCGGGG CCCCAGGCGC GGGCGCTCGC CTCGCTGCTC 
GCCGAGCCGG AGATCACCGC CTTCACCCTG CGCGCGACGG TGACGTTCGC GACCGTCTTC 
GCGGGGGTGC TCGCCGCCGC CGCCGGCGCG GCCATCGCCC CCGGCTCGCC GTGGCTCGCG 
GGCGTCGGGA TCGCGGCCGG CGCGGTGCTC CTCTCGCTGC CGCTCGCCGC CGGCGCGCGC 
GGCCTGGGCG CCGCCCACGG CGAGACGGTG GCGCTCGCCC TGGCGCCGCC GTTCCGGCTG 
CTGCGCCGGA TCGCCCGCCC GTTCGCGGCG GTGGTGGGCC TCCTCGCCGG GAAGCGCGCC 
CGCTTCTCCA ACCCGCCGCC GCCGCTCGAC GAGATGGAGC GCGCCCTCTC GGAGTACGCC 
CGCGTCCACG GCGTCGCCGG CGGTGGGGCC ACCACGAGCG AGCTCATCCA CGCGGTCTTC 
GAGTTCCGCG ACAAGATCGC CCGCGACGTG ATGGTGCCGC GCACCGAGGT GGTGGCGCTC 
GACGTGGACA CGCCGGTGCA CGAGATCCTG CGGCTCATGG CCGAGGAGGG GCACTCGCGG 
ATGCCGATCT ACCGCGGGAG CCTCGATCAC ATCCTCGGTG TCCTCCACGC GCGCGACCTC 
GTCCCGATGC TCGCGCACCC GGAGCTCATC GTGCTGCGGG ACATCCTGCG GCCCGCCCAC 
TTCGTCCCCT GGTCCAAGCC GATCGACCAG CTCCTGCGCG AGATGCAGCG CCGCCAGCTG 
CACATGGCGC TCGTGGTGGA CGAGTACGGC GGCGTGATGG GCGTGTGCAC CCTCGAGGAC 
GTCCTCGAGC AGATCGTCGG GGACATCGGC GACGAGTTCG ATCAGGCCGA GGGCAGGTCG 
GTGGAGGCCC ACGGCGACGG CTCGTTCACC GTCCTCGGGG CCACGGCCAT CGCCGAGTTC 
AACGCGTCGG CGGCCGCCGC GATCCCGGAG GACCAGGGGG TCGAGACCAT GGCCGGCTTC 
CTCAACTCGC TCGCCGGCGC CATCCCCGCG AAGGGCGACC GGTTCTTCTG GCGCGGCTGG 
GTGTTCACCG TCGCCGACGG CGACTCGCGC AAGGTGACCA AGGTCCGCGC CGCGCGCGTG 
AAGCGCGCCT GA

Protein sequence

MDPSIRHFLV LAASAAALLA VRALVAALEA ALVAVGTPRA QELAADPSAG PQARALASLL 
AEPEITAFTL RATVTFATVF AGVLAAAAGA AIAPGSPWLA GVGIAAGAVL LSLPLAAGAR 
GLGAAHGETV ALALAPPFRL LRRIARPFAA VVGLLAGKRA RFSNPPPPLD EMERALSEYA 
RVHGVAGGGA TTSELIHAVF EFRDKIARDV MVPRTEVVAL DVDTPVHEIL RLMAEEGHSR 
MPIYRGSLDH ILGVLHARDL VPMLAHPELI VLRDILRPAH FVPWSKPIDQ LLREMQRRQL 
HMALVVDEYG GVMGVCTLED VLEQIVGDIG DEFDQAEGRS VEAHGDGSFT VLGATAIAEF 
NASAAAAIPE DQGVETMAGF LNSLAGAIPA KGDRFFWRGW VFTVADGDSR KVTKVRAARV 
KRA