Gene Clim_0689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0689
Symbol
ID	6354303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	762561
End bp	764195
Gene Length	1635 bp
Protein Length	544 aa
Translation table	11
GC content	50%
IMG OID	642668316
Product	transcriptional regulator, NifA subfamily, Fis Family
Protein accession	YP_001942751
Protein GI	189346222
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID	[TIGR01817] Nif-specific regulatory protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.430174
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCATTC CCCAGAAAAA AAAAGACAGC AGCATCAGCC TTCTGGCTGA AGTCAGCAGA 
ACTGTAACGA TTGAAAAAGA TATCAGCAAG GTGCTCCGCC TGGTACTTTT CATCATGTCG 
GAGCATATGG ATATGCTTCG CGGAATGATC ACCATTCTCA ACCGCGATAA TGACGAAATA 
GTCATCAATG AATCATTCGG ACTGAGCGAA GAAGAAAAAG AACGTGGACG CTACCGGATA 
GGAGAGGGCA TTATCGGTCA GGTCGTAAAA ACCGGTAAAC CGGTTCTGGT ACCAAATATC 
AATGATGAAC CATTGTTCCT TGACCGTACC CGTTCCCGTC AGAAGGAGAG AACCGACGAC 
CTTTGTTTCA TCTGCATTCC CATAAAGACG GGAACCGAGA TCATCGGAAC CCTCAGCGCC 
GATCGTCAGA TTGAACCGCC ATTTCCCGAA GACCCGTCGA AACGGGCCAA AGCGGAAAGC 
GAACGGATGG ACATGATGCA GCACTACGTC GACCTGCTTT CCATTATCGC GTCCATGATT 
TCTCAGGCGG TAAGGCTCAA ACAGCTTGCT CACGAGGAGA ACTCGAATGG AACAGGCACA 
ACGCACTCGC TGAAAGGGAA AAATCTGCTC ATCCCTCACC GGGACAATGA CAGCCATGAG 
GAAGAGGTGG ATGAAACGGA ACGCCCGGCA AACATTATCG GCAATGCAAA ACCGATGATG 
TCATTGTTCA AAATGATCGA CAAAATCGCA AAAACCAGTG CGACAACTCT GGTGCTGGGC 
GAAAGCGGTG TAGGCAAAGA ACTCGTCGCC AGCGCCATTC ACTTTAAAAG CCGTCGCTCC 
GACAAGCCGT TTATCAAATT CAATTGTGCA GCCCTACCGG AAAGCATTGT AGAAAGCGAG 
TTGTTCGGCC ATGAAAAAGG CTCTTTTACC GGAGCCTCGG GTATGCGTCA GGGACGGTTC 
GAGCTGGCCC ATACCGGCAC GATATTTCTT GATGAGATCG GAGAACTCAG CTTGCCGGTA 
CAGGCGAAAC TGCTTCGCAT CCTTCAGGAA AAAGAGTTCG AACGGGTTGG CGGCTCGAAA 
ACCATCAAAG TCGATGTCAG AGTTATTGCC GCAACCAACA GGAACCTGGA AAACCTCATC 
CGTGAAGGAC AGTTCAGGGA AGATCTGTTC TATCGGCTGA ATATTTTTCC GTTGACCGTA 
CCGCCGCTCA GGGAGAGAAA AACCGATATA CTGCTGCTCG CAGATTACTT CGTCGAAAAA 
TATAACCGGA TCAACCAGAA AGGAATCCGC CGAATTTCAA CGACATCGAT AGACATGCTG 
ATGCGCTACC ACTGGCCCGG CAATGTGCGT GAACTGGAAA ACTGCATGGA ACGAGCGGTC 
ATTCTCAGCG AAGATAACGT CATTCACGGC TATCACCTTC CGCCAAGCCT GCAGACTGCG 
GAATCGAGCG GCACCCCGTA TACCGGCTCA CTGCAGCAAA AGCTTGACTC GATCGAAAAT 
GAAATGATCA TCGAAGCGCT CAAACGCACA AAAGGAAATA TGTCACGGGC GGCTATACAA 
CTCGGCCTCT CGGACAGAAT CATGGGGTTA CGGGTAAAAA AATTCAACAT CGACTATCGA 
AAGTTCCGTA TATGA

Protein sequence

MLIPQKKKDS SISLLAEVSR TVTIEKDISK VLRLVLFIMS EHMDMLRGMI TILNRDNDEI 
VINESFGLSE EEKERGRYRI GEGIIGQVVK TGKPVLVPNI NDEPLFLDRT RSRQKERTDD 
LCFICIPIKT GTEIIGTLSA DRQIEPPFPE DPSKRAKAES ERMDMMQHYV DLLSIIASMI 
SQAVRLKQLA HEENSNGTGT THSLKGKNLL IPHRDNDSHE EEVDETERPA NIIGNAKPMM 
SLFKMIDKIA KTSATTLVLG ESGVGKELVA SAIHFKSRRS DKPFIKFNCA ALPESIVESE 
LFGHEKGSFT GASGMRQGRF ELAHTGTIFL DEIGELSLPV QAKLLRILQE KEFERVGGSK 
TIKVDVRVIA ATNRNLENLI REGQFREDLF YRLNIFPLTV PPLRERKTDI LLLADYFVEK 
YNRINQKGIR RISTTSIDML MRYHWPGNVR ELENCMERAV ILSEDNVIHG YHLPPSLQTA 
ESSGTPYTGS LQQKLDSIEN EMIIEALKRT KGNMSRAAIQ LGLSDRIMGL RVKKFNIDYR 
KFRI