Gene Cag_1523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1523
Symbol
ID	3747157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1999556
End bp	2002366
Gene Length	2811 bp
Protein Length	936 aa
Translation table	11
GC content	44%
IMG OID	637774063
Product	DEAD/DEAH box helicase-like
Protein accession	YP_379821
Protein GI	78189483
COG category	[V] Defense mechanisms
COG ID	[COG4096] Type I site-specific restriction-modification system, R (restriction) subunit and related helicases
TIGRFAM ID	[TIGR00756] pentatricopeptide repeat domain (PPR motif)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTATAT CCGAAGCGCA AACTCGTTCC CAGCTTATTA ATAAGCTGCT TGCCCAATCA 
GGGTGGAATG TTAACGACCA AACGCAAGTT GTTGCGGAAT TTGACATTGC AATATCGCAC 
ACCCAGCACA TAGCGGAACC ACTCACCCCA TACCACAGTC ATCAGTTTAG CGATTACGTT 
TTACTCGGTA AAGATGGTAA GCCCTTAGCC GTTATTGAAG CTAAAAAGAC AAGTAAGAAT 
GCAGCTTTAG GGCGCGAACA AGCCAAGCAA TACTGTTACC ATGTGCAGCG TCAGCAAGGT 
GGAGTGCTTC CATTTTGCTT TTACACCAAT GGGCTTGAAA CATACTTTTG GGATTTAGAG 
AATTACCCTC CACGCAAAGT GGTAGGTTTT CCAACCCGCG ATGATCTTGA ACGATTTCAC 
TATATCCATC GCAACAAAAA GCCGTTGACG CAAGAGCTGA TTAATACCGC TATTGCTGGT 
AGAGATTACC AAATACGGGC TATTCGGGCA GTACTTGAAG GCATCGAACA AAAAAGGCGA 
GATTTTCTCT TGGTTATGGC AACGGGCACA GGCAAAACCC GTACTTGTAT TGCGTTAGTG 
GATGCGCTTA TGCGTGCTGG TCATGCTGAA AAAGTGCTCT TTTTGGTTGA TCGTATTGCG 
TTACGTGAGC AGGCGTTAGA TGCGTTTAAA GAGCATTTAC CTAATGAACC TCGCTGGCCT 
AATAAGGAGG AAACTCTTAT TGCTAAAGAT CGCCGCATTT ACGTTGCCAC CTATCCAACA 
ATGCTGAACA TCATCAGGGA TGAAGCGCAG CCTCTTTCGC CGCACTTTTT TGATTTCATC 
GTAGTTGATG AAAGCCATCG CTCCATTTAC AACACCTATG GCGAAGTTCT TGATTATTTT 
AAAACGCTCA CGCTTGGATT AACGGCTACA CCTACCAACG TTATTGATCA CAACACCTTC 
CAGCTTTTTC ATTGCGAAGA TGGGCTTCCA TCCTTTGCCT ATACCTATGA AGAGGCTGTA 
AATAATGTGC CGCCTTACTT GTGCAATTTT CAGGTTATGA AAATTCAGAC CCGCTTTCAG 
ATGGAGGGCA TTAGCAAGCG TACCATTTCG CTTGACGATC AAAAAAAGCT GATGCTTGAA 
GGCAAGGAGG TTGAAGAAAT CAACTTTGAA GGTACGCAGC TTGAAAAGCA AGTAACCAAC 
AAAGGCACCA ACACACTCAT TGTGAAGGAG TTTATGGAGG AGTGCATCAA GGATCAACAT 
GGCGTATTGC CTGGAAAAAC CATCTTTTTT TGCTCTTCCA CAAAACATGC TCGGCGTATT 
GAAGAAATTT TTAACGCTCT TTATCCCGAA TACAAAGGTG AACTTGCTAA AGTGCTGGTT 
TCTGATGATT CCCGTGTTTA TGGTAAGGGT GGATTGCTTG ACCAGTTTAA AACCAACGAT 
ATGCCTCGCA TTGCCATTAG CGTTGACATG CTCGATACGG GCATTGATGT GCGCGAAATT 
GTCAACCTTG TGTTTGCTAA ACCTGTTTAC TCATACACCA AGTTTTGGCA AATGATTGGG 
CGCGGCACTC GTTTGTTAGA AACCAGCAAA CCCAAACCTT GGTGCACCGC AAAAGATGTT 
TTTCTCATCC TCGATTGTTG GGACAACTTT GAATACTTCA AGTTGAATCC CAAAGGCAAA 
GAGCTACCAT CGCAACTGCC ATTGCCCGTG CGCTTTGTTG GCTTACGGAT TGATAAAATT 
GAAGCTGCCA TTGATCGCAA CCGTGTAGAA ATTGCTGAAC GCGAAATAAG CAAGCTACGT 
GCCCAAATTG CCCAACTACC TCAAAACTCT GTGGTTATAA AAGAGGCTGC AACTGCATTA 
GCGCAAATTG AAGCAGAACA TTTCTGGGAC TTGCTTAATC ATCAAACCTT AGAATTTTTA 
CGCACTGAAA TTAAGCCGCT CTTCCGCACT CTTTCGGATG TTGATTTTAA AGCCATGCGC 
TTTGAGCGCG ACTTGCTGGA ATACTCCTTA GCTGCTTTGC GTGAGGAAAA AGAAAAAGCC 
GAAACCCTGA AGGAAGCTAT TGTTGAACAA ATCAGCGAGT TGCCACTTTC AATTCCTTTT 
GTTAAGGCTG AAGAGGAGTT AATTCGTGCA GCCCAAACCA ACTATTATTG GGCAAAAGAT 
GATGCGATTG CACTGGAAGA GACGCTGGAC AAGCTCAATA GTCGGCTTGG CGGATTAATG 
CAATTCCGCG AGCAAACCGA AGAGAGAGAA ACGGTACACC TTGATTTACG TGATGAAATT 
CATCGCAAAG AGATGGTTGA GTTTGGTCCG CAGCATGAAT CGGTAAGCAT TAGCCGCTAT 
CGTGAAATGG TTGAGGGTAT GATTGCCGAA TTAACGGAGC ACAATCCCAT TTTGCAAAAA 
ATAAAGATGG GCGAAAAGAT TTCCGCAATT GAAGCCGATG AGCTTGCCGC AATGCTCCAC 
GCCGAACATC CGCACATTAC CGAAGAGTTG CTACAGCAAG TGTATAACAA TCGCAAGGCG 
CATTTCATCC AATTTATTCG GCACATTCTT GGCATTGAGC AATTAAAAAG CTTTCCTGAA 
ACCGTGAGTG AAGCCTTTGA ACAATTTATT CAACAGCACA GCAACCTCTC AAGCCGTCAA 
TTGGAGTTTC TTAATTTGCT GAAGGGCTTC ATTATTGAAC GTGAAAAGGT TGAGAAGAAA 
GACCTTATCA ATGCTCCATT TACGGTGATT CATCCGCAAG GCATTCGTGG AGTTTTCAAA 
CCTTCCGAAA TCAATGAAAT ACTGAAATTA ACCGAGCAAC TTGCGGCTTA A

Protein sequence

MTISEAQTRS QLINKLLAQS GWNVNDQTQV VAEFDIAISH TQHIAEPLTP YHSHQFSDYV 
LLGKDGKPLA VIEAKKTSKN AALGREQAKQ YCYHVQRQQG GVLPFCFYTN GLETYFWDLE 
NYPPRKVVGF PTRDDLERFH YIHRNKKPLT QELINTAIAG RDYQIRAIRA VLEGIEQKRR 
DFLLVMATGT GKTRTCIALV DALMRAGHAE KVLFLVDRIA LREQALDAFK EHLPNEPRWP 
NKEETLIAKD RRIYVATYPT MLNIIRDEAQ PLSPHFFDFI VVDESHRSIY NTYGEVLDYF 
KTLTLGLTAT PTNVIDHNTF QLFHCEDGLP SFAYTYEEAV NNVPPYLCNF QVMKIQTRFQ 
MEGISKRTIS LDDQKKLMLE GKEVEEINFE GTQLEKQVTN KGTNTLIVKE FMEECIKDQH 
GVLPGKTIFF CSSTKHARRI EEIFNALYPE YKGELAKVLV SDDSRVYGKG GLLDQFKTND 
MPRIAISVDM LDTGIDVREI VNLVFAKPVY SYTKFWQMIG RGTRLLETSK PKPWCTAKDV 
FLILDCWDNF EYFKLNPKGK ELPSQLPLPV RFVGLRIDKI EAAIDRNRVE IAEREISKLR 
AQIAQLPQNS VVIKEAATAL AQIEAEHFWD LLNHQTLEFL RTEIKPLFRT LSDVDFKAMR 
FERDLLEYSL AALREEKEKA ETLKEAIVEQ ISELPLSIPF VKAEEELIRA AQTNYYWAKD 
DAIALEETLD KLNSRLGGLM QFREQTEERE TVHLDLRDEI HRKEMVEFGP QHESVSISRY 
REMVEGMIAE LTEHNPILQK IKMGEKISAI EADELAAMLH AEHPHITEEL LQQVYNNRKA 
HFIQFIRHIL GIEQLKSFPE TVSEAFEQFI QQHSNLSSRQ LEFLNLLKGF IIEREKVEKK 
DLINAPFTVI HPQGIRGVFK PSEINEILKL TEQLAA