Gene Anae109_3359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_3359
Symbol
ID	5374344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	3925845
End bp	3927869
Gene Length	2025 bp
Protein Length	674 aa
Translation table	11
GC content	69%
IMG OID	640844873
Product	NifA subfamily transcriptional regulator
Protein accession	YP_001380527
Protein GI	153006202
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAAG TAGCTACCCG GTATGACGAG CGCGGCATCA CCATGGACAC CCCTCCCTCT 
CTACGGACGC CCGGGCAGCA GGCGATGACG GACGAGGGCT GGCACCAGCT CTTCGAGCAC 
TCGGCCATCG GGGTGACGCT CGCCGATCTC GAAGGGCACC TCGTCCACGT GAACCGCGCC 
TACTGCGCGA TGCTCGGCTA CACGGAGGTC GAGCTCGAGG GGCACTCGTA CGTCTCCCAT 
GCACACCCGG ATGATCGCGC GCGCCACCTG ATTCTCGTTC GCGAGCTGCT CGCCGATGCC 
CGCGCCCATT TCCAGGTCGA GGAGCGGTAC GTCCGCAAGG GCGGCTCGGT GATGTGGGTC 
AGCAACAGCG TGTCGCTGGT GCCGCCCCGG GGCGGCTCGC GCCGGATCCT CATCCTCGGG 
CTCGTCGAGG ACATCACCGA GCGCATGCGC CTCCGTGACG AGCTGGACGC CGAGCGGAAC 
CGGCTACGCC TTCTGCTCGA CGTCAACGAG CTCCTGGTCG CGCACCTCGA CCTTCGGGAG 
ATGTTCCAGG CGCTCGCGTC GAGCCTGCGG AGGGTCACGG ATTGCCACTT CATCGGTCTC 
GCCCTGCCCG ACGCCGCGAC GGGCGAGCTG CGGCAGCACA TCGTCGACCA TCCGGACGGG 
AAGGGTGCCA TCACCGAGGG CATGGTGCTG CCTCTTCACG GCTCCGCCTC CGGCAAGGCG 
TTTCGCACGG GCGCGCCCGT CTTGTTGAAC GACCCGGAGG CGAACCGCCA GGACCCGGAC 
CTGTATGGCA CTCCCGAGGG AGCGCGGTTC TATCGGACCG TGCTCGAGGA AGGAGTTCCT 
TCGGGATACG TCCTGCCGCT CGTTCACCGT GGCGAGGTGC TGGGCGTCCT CCAGCTCAAG 
AAGTACGCGG ACGCTCGATT CAAGGAACGA GAGATCGAGT TCATGTCCAA GGTGGCGGGC 
CAGCTCTCGA TCGCGGTGGC GAACGCCCTC GAGTACCGCG AGGTCAAGGA GTCGAAGGAG 
CGGCTGGACA GGGAGCGGGT CTACCTGAAG GAGGAGATCC GGTCTGCGCA CGACTTCGAG 
GAGATCATCG GGGTGAGCCG CACGCTGAAG CAGGTGCTCG GCCAGATCGA CACGGTCGCG 
GTCACGGACT CGACCGTCCT CATCCTGGGG GAGACCGGCA CGGGCAAGGA GCTGATCGCG 
CGCGCCATTC ACAACCGCAG CCGGCGGCGT GACCGTCCAT TCGTGAAGGT CAACTGCTCC 
GCGATCCCCA CCGGGCTCCT CGAGAGCGAG CTCTTCGGCC ACGAGCGCGG CGCCTTCACC 
GGGGCCACCG CGCCCAGGAT CGGACGCTTC GAGGCGGCCG ACCAGGGGAC GCTGTTCCTC 
GACGAGATCG GGGACCTCCC CGTGGACCTG CAGCCCAAGC TGCTCCGGGT CCTCCAGGAG 
CGCGAGTTCG AGCGGTTGGG CGCCAGCCGC ACGCGACGGG TCGACGTCCG GGTCGTCGCG 
GCGACGAACC GGGGACTCGC CACGATGGTC GGGGAGGGCA GGTTCCGGGA GGATCTGTAC 
TACCGGCTGA ATGTCTTCCC CATCACGCTT CCACCGCTGC GGGAGCGCGC CGGGGACATC 
CCGCTCCTCG TGCGGCACTT CGTCGGCGTC TACGCCCGGC GGATGGGCAA GCAGATCGAC 
CACATCCCCG ACGCGTCCAT GCGCGCGCTG GTCGGCTATC ACTGGCCGGG CAACGTACGC 
GAGCTGCAGA ACGTGATCGA GCGGGCGGTG ATCCTCACCC CCGGTGCGGT CCTCGAGCTG 
GCGCTCGCCG AAAGGGCCGC CGGCGCCCGG GAAGATCGAC CGGACGCCGC GGCACCCAAC 
GGCCACCGCA CGCTGCAGGA GGTGGAGCGT GAGCACATCC TGGGCGCGCT CCAGGAGGCC 
AAGTGGGTGA TCGGCGGCCC GAACGGCGCG GCCGCGCGTC TCGGCCTACG GCGCACCTCG 
CTCATGTACC GGATGGAGAA GCTGGGCATC GCTCGACCGA CGTGA

Protein sequence

MTEVATRYDE RGITMDTPPS LRTPGQQAMT DEGWHQLFEH SAIGVTLADL EGHLVHVNRA 
YCAMLGYTEV ELEGHSYVSH AHPDDRARHL ILVRELLADA RAHFQVEERY VRKGGSVMWV 
SNSVSLVPPR GGSRRILILG LVEDITERMR LRDELDAERN RLRLLLDVNE LLVAHLDLRE 
MFQALASSLR RVTDCHFIGL ALPDAATGEL RQHIVDHPDG KGAITEGMVL PLHGSASGKA 
FRTGAPVLLN DPEANRQDPD LYGTPEGARF YRTVLEEGVP SGYVLPLVHR GEVLGVLQLK 
KYADARFKER EIEFMSKVAG QLSIAVANAL EYREVKESKE RLDRERVYLK EEIRSAHDFE 
EIIGVSRTLK QVLGQIDTVA VTDSTVLILG ETGTGKELIA RAIHNRSRRR DRPFVKVNCS 
AIPTGLLESE LFGHERGAFT GATAPRIGRF EAADQGTLFL DEIGDLPVDL QPKLLRVLQE 
REFERLGASR TRRVDVRVVA ATNRGLATMV GEGRFREDLY YRLNVFPITL PPLRERAGDI 
PLLVRHFVGV YARRMGKQID HIPDASMRAL VGYHWPGNVR ELQNVIERAV ILTPGAVLEL 
ALAERAAGAR EDRPDAAAPN GHRTLQEVER EHILGALQEA KWVIGGPNGA AARLGLRRTS 
LMYRMEKLGI ARPT