Gene Cag_0391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0391
Symbol
ID	3747559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	453655
End bp	455643
Gene Length	1989 bp
Protein Length	662 aa
Translation table	11
GC content	49%
IMG OID	637772919
Product	peptidase M41, FtsH
Protein accession	YP_378707
Protein GI	78188369
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0465] ATP-dependent Zn proteases
TIGRFAM ID	[TIGR01241] ATP-dependent metalloprotease FtsH

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0150338
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGAAA AACCAACCAA AAAATCATCC CCCAATAATT CGCGCAACCC CTTTAAACCT 
GTTGATGACG ATAATGGCGG TGGCATGGGT AACTCGGGCA ATGGCAGCCC ACTGCCTCGC 
TTTCCCCGTA TGCTCATTAT TGTTATGATT GGTATGCTGG TGCTTTTTAC AGGGCAGCGC 
TTTTTTGGCA CCGCAGCAAA TCCTGAAATT AGCTACAACG AGTACAAGTC GCTTTTAGAG 
CGCTCGCTTA TTGCTGAAAT TACCATTAGC AGTGGCGAAG AGCGTTCGAC GCTGCTCAAT 
GGACGGCTTA CCGCACCAAC AAAATTGCAG CTTGTTAACC AAGCGCTCCA ACAAAGCGAT 
CGCTTTTCGG TACGAGTGCC CTCGGTGTCG CTGGAGCAAA CCGATGCGTT GGCAGCCAAA 
GGCATTCGCG TTAAGGTGGA AGAGAATTCA GGCGGTCTTA AAACCTTTTT AATCCTTTTT 
GCGCCTTGGC TCATTTTTGG GCTGATTTAC TTTTTTGTGA TGCGCAATAT GAATGGAGCC 
AACAATGCGC AGGCAAAAAA CATGTTTAAC TTTGGCAAAA GTCGTGCTAA AATGGCGAGC 
GAGTTTGATG TTAAAGTTAC CTTTAAAGAT GTAGCTGGCG TTGACGAAGC CATTGAGGAG 
TTGAAGGAAA CCGTGGAGTT TTTAGTAAAT CCTGAAAAGT TCCAGAAAAT AGGCGGCAAA 
ATTCCTAAAG GCGTTTTGTT GCTGGGTCCT CCAGGTACCG GTAAAACCTT GCTTGCTAAG 
GCAATTGCAG GTGAAGCCAA AGTGCCATTT TTCTCCATGT CGGGTGCCGA TTTTGTTGAA 
ATGTTTGTGG GTGTAGGAGC TTCTCGTGTG CGCGATTTGT TTGAGCAAGC GAAGAAAAAC 
GCGCCTTGCA TTATTTTTAT TGATGAAATT GATGCCGTTG GTCGCAGCCG TGGCGCTGGG 
CTTGGCGGTG GACACGATGA GCGTGAGCAA ACGCTTAACC AGTTGTTGGT GGAAATGGAT 
GGTTTTGGTA CCACCGATAA TGTGATTTTA ATTGCCGCAA CTAACCGTCC CGACGTGTTG 
GATTCAGCAC TTTTACGTCC CGGACGCTTT GATCGTCAAA TCACCATTGA TAAACCCGAC 
ATTCGTGGAC GTGAAGCCAT TTTAGCCATT CACACCCAAA AAACACCGCT TGATGAGAGC 
GTTACCCTAA CGGTGTTGGC AAAAAGTACC CCTGGTTTTT CAGGTGCCGA CTTAGCCAAT 
TTGGTGAACG AAGCGGCACT TTTAGCTGCA CGTCAAGAAG CCGAGCGCAT TACCGCAACC 
CATTTTGAGC AAGCACGCGA CCGCATTTTA ATGGGTCCCG AGCGCCGAAG CATTTACATT 
TCGGACGAGC AAAAAAAGCT TACCGCATAC CACGAAGCAG GGCATGTGTT GGTTGCACTT 
TTTACTCCGG GTTCCGACCC CGTGCACAAG GTTACCATTA TTCCGCGTGG ACGTAGCCTT 
GGCTTAACCT CGTACCTGCC GTTAGAAGAT CGCTACACGC AAAATCGTGA ATATTTAGTG 
GCAATGATTT CCTACGCACT TGGTGGACGT GCGGCTGAAG AGCTGATTTT TAACGAAGTA 
AGCACGGGTG CCTCAAACGA TATTGAACGC GCAACCGATA TTGCACGCCG TATGGTGCGC 
CAGTGGGGCA TGAGCGAAAA GCTGGGTCCC GTCAATTACG ACAGCGGCAC CCATCGCGAA 
GTGTTCCTTG GCAAAGATTA TTCACATGTT CGTGAATACA GTGAAACAAC GGCGCTGCAT 
ATTGATAACG AAGTACACGC CATTATTAGC GGTTGCATGG AGCAAGCCAA AACAATTCTT 
ACCACAAAGC AAGAGTTGTT GCACCGCCTT GCCTTGCAGT TAATTGAGAA GGAATCGCTC 
AGCGCCGCAG AAATTGCCGA GCTTACGGGC ACGGAGCTGC CGACTTCCAC CCCAACGCTG 
AAGCAGTAA

Protein sequence

MAEKPTKKSS PNNSRNPFKP VDDDNGGGMG NSGNGSPLPR FPRMLIIVMI GMLVLFTGQR 
FFGTAANPEI SYNEYKSLLE RSLIAEITIS SGEERSTLLN GRLTAPTKLQ LVNQALQQSD 
RFSVRVPSVS LEQTDALAAK GIRVKVEENS GGLKTFLILF APWLIFGLIY FFVMRNMNGA 
NNAQAKNMFN FGKSRAKMAS EFDVKVTFKD VAGVDEAIEE LKETVEFLVN PEKFQKIGGK 
IPKGVLLLGP PGTGKTLLAK AIAGEAKVPF FSMSGADFVE MFVGVGASRV RDLFEQAKKN 
APCIIFIDEI DAVGRSRGAG LGGGHDEREQ TLNQLLVEMD GFGTTDNVIL IAATNRPDVL 
DSALLRPGRF DRQITIDKPD IRGREAILAI HTQKTPLDES VTLTVLAKST PGFSGADLAN 
LVNEAALLAA RQEAERITAT HFEQARDRIL MGPERRSIYI SDEQKKLTAY HEAGHVLVAL 
FTPGSDPVHK VTIIPRGRSL GLTSYLPLED RYTQNREYLV AMISYALGGR AAEELIFNEV 
STGASNDIER ATDIARRMVR QWGMSEKLGP VNYDSGTHRE VFLGKDYSHV REYSETTALH 
IDNEVHAIIS GCMEQAKTIL TTKQELLHRL ALQLIEKESL SAAEIAELTG TELPTSTPTL 
KQ