Gene Anae109_3167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_3167
Symbol
ID	5375063
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	3712227
End bp	3713285
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	74%
IMG OID	640844691
Product	helix-turn-helix domain-containing protein
Protein accession	YP_001380347
Protein GI	153006022
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAAGC ACACCGTCTC CATGCATTTC GTGGGCGCCG CCGTCGCCGG GCTCTCGGGA 
GAGGCGCGCG CGCGGGTGCT GGCGTCCGCC GGCATCCCCT CGGAGCTCCT CGCGGCATCC 
CACGCGCGGG TGCCCGCCGA GTCCTTCTCG GCCCTGTGGC TCGCCGTCAA TCGCGAGCTC 
GACGACGAGT TCTTCGGCCT CGATCGGCGG CGGATGAAGT GCGGCAGCTT CGCCCTGCTG 
TGCCACGCGG TGCTGCACGC CGGGAGGCTC GACCGCGCGC TGCGGCGGAT GCTGAGGGGG 
TTCGCGGCGT TCCTGGACGA CGTCCAGGCG GAGCTGCGCG TGGACGGGCC GGACGCGGTC 
GTCGCGGTCA CGAACCGCAT CGAGGCCGCC CAGGCTCGCC GCTTCGCGGA CGAGACCTTC 
CTCATCATGG TGCACGGGCT GATGTGCTGG CTGGCGGGGC GGCGGATCCC GCTCACGATG 
GCGGAGTTCG CGCACCCGCG GCCCACCCAC GCGCAGGAGT ACACCGTCAT GTACTCGCAG 
CGGCTGCGGT TCGACGCGGA GCGCACGGCG GTCCGGTTCG ACGCGCAGCT CCTCGCGTTG 
CCCGTCGTGC AGAACGCCAC CGCCCTGAAG ACGTTCCTGC GCACCGCGCC GCAGTCGGTG 
TTCCTCAAGT ACACGAACGA GGACAGCTGG ACGGCCCGGC TGCGCCGGCG CCTGCGCGGG 
AGCATCGGCC GCGAGGAGTG GCCCCGGCTC GAGGACGTGG CGCGCGAGTT CCACGTCGCG 
CCGACGACGC TCCGCCGCAG GCTCGACGCG GAGGGGACGA GCTACCAGGG CATCAAGGAC 
GAGCTGCGCC GGGACGCGGC CGTCCATCAC CTGTGCGGCA GCCGCCTGAG CGTCGCCGAG 
ATCGCCGCCT CCCTCGGCTT CCAGGAGACG AGCGCGTTCC ACCGCGCGTT CAAGCGCTGG 
AGCGGCGTGC AGCCCGGGGA GTACCGCAGG CGGCAGGCCG AGCTCGGGCC GGGGCGGGCG 
GACGACGCGC CGCCCCCGCC CGCCCTGGCG CGAGGCTGA

Protein sequence

MQKHTVSMHF VGAAVAGLSG EARARVLASA GIPSELLAAS HARVPAESFS ALWLAVNREL 
DDEFFGLDRR RMKCGSFALL CHAVLHAGRL DRALRRMLRG FAAFLDDVQA ELRVDGPDAV 
VAVTNRIEAA QARRFADETF LIMVHGLMCW LAGRRIPLTM AEFAHPRPTH AQEYTVMYSQ 
RLRFDAERTA VRFDAQLLAL PVVQNATALK TFLRTAPQSV FLKYTNEDSW TARLRRRLRG 
SIGREEWPRL EDVAREFHVA PTTLRRRLDA EGTSYQGIKD ELRRDAAVHH LCGSRLSVAE 
IAASLGFQET SAFHRAFKRW SGVQPGEYRR RQAELGPGRA DDAPPPPALA RG