Gene Clim_0716 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0716
Symbol
ID	6354330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	789106
End bp	790680
Gene Length	1575 bp
Protein Length	524 aa
Translation table	11
GC content	51%
IMG OID	642668343
Product	Integrase catalytic region
Protein accession	YP_001942778
Protein GI	189346249
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.323373
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGACAC AGTTAAAAAA GCTAACCATG TACAACAAAG TTAAGGAATT TGCCCGAGAA 
GGATTAAGCA TCCGTCAAAT CAGCCGAAAG ACGGGCATGG ACAGAGTGAC GGTGCGCAAG 
TTTCTCCGCA TGACCGATGA GGAATTCAGT GCGTTTCTTG CTCTGCAGAA GCGGCGCCTG 
CGAAAATTGC AGCCTTATGA ACAGTTCGTC AAGGATAGGG TTACCGACTA TCCTGACTGC 
AGTGCAACTC AAGTTGAAGA CTGGCTGAAG GAGCATCACC CGGACTTTCC AGAGGTAACG 
ACTCGAACGA TCTATTCTTT TGTCCAGTGG ATCCGAAAAA CCTATGATCT TCCAAAACCG 
AAAGGAACCC CTCGTGCCTA TCATCCGGTC GAGCAACTTC CTTACGGAGA GCAGGCGCAG 
GTTGATTTCG GTGAGTACTG GATGGCGAGT GCTGATGAAC ACAACGTGAA GGTTCACTTC 
ATGATTATGC TGCTCTCCCG AAGCCGCAGG AAGTTTGTCA GCTTCAGCCA GCAACCGATT 
ACGACCCGTT TTGTGCTTGA AGCTCATGAA CAGGCATTTG CCTTTTTTGA GGGCATACCG 
CACACACTGG TTTATGATCA GGACTCAACC ATTGTTTCCG ATGAGAACCG GGGTGCCATC 
CTTTATACGG AGGCGTTCAG GAAGTACCTG TTGCACCGCA GTCTGAAGAT CCATCTCTGT 
CGGAAAAGCG ATCCGGAAAG CAAAGGGAAA ATCGAAGCCG GCGTCAAATA TGTGAAGTAC 
AACTTCCTGC CGGGGCGACG CTTCGTCAAT CTTGAAGTCC TGAACCAGGA AGCGTTGCTC 
TGGCTTGAAC GAACGGCCAA TGCCAAAGAA CATGCCACAA CGCGGCTGAT ACCTGAGGCA 
GAATGGCAGG TGGAAAAACA GCATCTTCGT CCTTTTGAGC CCTTACCCTA TCCGATTTCC 
GGGCCTGTCG GTAAAGAGTA CCATGTACGC AAAGACAACA CAATCTCGTA TCGAGGGAAT 
TTCTATAGCC TGCCGGTCGG CACCTATGCA GGGCCGGGGA CACTGGTTGT GCTGGAAGTC 
AGGCAGAACA CCCTTTGTCT CTATGCTCAT GACGGCAGGT TGCTGGCCAA TCACCCGATT 
AAGAGCGGCA AAGGTACCGT GGTGGTCAAC AACCACCACC GACGCGATAC TTCCGCCAAA 
CGGCGAGAGT TGCAGGACTC GCTCAAGCCG CTTTTCACCA ATCAGGAACA GGCGGAACTG 
TTTCTTGAAA GCATCCACAA CCGTTATCCC CGGTACAGTC GGGACCAGTT CCTGCATGTA 
CGCAATACCA TCAGCGGATG CCGGCAGAAG CTGATAGATG AGGCCCTCGC ATACTGTGTC 
GATCATCATC TCTTTTCATC CGGTGAGTTC CATGATATCC TGCACCATTA CCGAAAGCGG 
GAAGAAAAAC AGAGTCATCC GACGGTCTCC AACACCTTCC GCCCGAAAAC ACGCCGAAGC 
GACCTGAACA GGATGCTCTC GTTCGTGCCG GACAGCAGTA CCATAACCAC CTATGAAACC 
ATTTTCAGCT GTTAA

Protein sequence

MRTQLKKLTM YNKVKEFARE GLSIRQISRK TGMDRVTVRK FLRMTDEEFS AFLALQKRRL 
RKLQPYEQFV KDRVTDYPDC SATQVEDWLK EHHPDFPEVT TRTIYSFVQW IRKTYDLPKP 
KGTPRAYHPV EQLPYGEQAQ VDFGEYWMAS ADEHNVKVHF MIMLLSRSRR KFVSFSQQPI 
TTRFVLEAHE QAFAFFEGIP HTLVYDQDST IVSDENRGAI LYTEAFRKYL LHRSLKIHLC 
RKSDPESKGK IEAGVKYVKY NFLPGRRFVN LEVLNQEALL WLERTANAKE HATTRLIPEA 
EWQVEKQHLR PFEPLPYPIS GPVGKEYHVR KDNTISYRGN FYSLPVGTYA GPGTLVVLEV 
RQNTLCLYAH DGRLLANHPI KSGKGTVVVN NHHRRDTSAK RRELQDSLKP LFTNQEQAEL 
FLESIHNRYP RYSRDQFLHV RNTISGCRQK LIDEALAYCV DHHLFSSGEF HDILHHYRKR 
EEKQSHPTVS NTFRPKTRRS DLNRMLSFVP DSSTITTYET IFSC