Gene Cag_1575 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1575
Symbol
ID	3747132
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2058740
End bp	2060002
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	51%
IMG OID	637774115
Product	hypothetical protein
Protein accession	YP_379873
Protein GI	78189535
COG category	[R] General function prediction only
COG ID	[COG4277] Predicted DNA-binding protein with the Helix-hairpin-helix motif
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00249963
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATACTC TTACGAAATT GCGCATTCTT TCGGGCGCGG CTCGTTACGA TGCTTCGTGT 
GCGTCGAGTG GGAGCAATCG TAGTGGCGCT TCGTGCGGTA TTGGTAATAC GTCGCAAAGT 
GGTATTTGCC ATTCGTGGTC GGATGATGGG CGCTGTATTT CTCTCTTAAA AATTCTCCTC 
TCAAACGATT GTTGCTACAA TTGCGCTTAT TGCGTGAATC GTGCCACCAA TCCCGTTGAG 
CGTGCCTCGT TTACGGCGCG TGAAGTGGTT GACTTAACGC TTGACTTTTA CCGCCGTAAC 
TATATTGAGG GATTGTTTTT AAGTTCGGCG GTTATGCAAA GCCCCGATGC CACTATGGAG 
CGTATGGTGG CTGTGGCTGA AACGTTGCGG AGCGAGGAGC GTTTTGGCGG TTACATTCAC 
CTGAAAATTA TTCCGGGTGC CAGCAGCGAG TTGGTGCGTA AAGCGGGGCT TTATGCTGAC 
CGCATTAGTG TGAATATTGA GCTGCCGTCG CAAGTGTCGT TAGAACGTTT GGCGCCGCAA 
AAGCATCGGG CGGCAATTTT AGAGCCGATG GCGCTCATTG GGCGCGAAAT TAACACAAGC 
CTTGTGGAGC GTCAGCATAG TCATCGGGCA CCTCGTTTTG CGCCAGCAGG GCAGAGCACG 
CAAATGATTA TTGGTGCTAC GCCCGAAAGC GATTTTCAAA TTTTGCGCCT TTCGCAAGGG 
TTGTATAAAA AAATGAACCT CAAGCGGGTC TATTACTCGG CTTACGTGCC CGTTAGTGAG 
GATAACCGTT TGCCCGTGCT TGCAGCGCCA CCGCTTTTGC GCGAACATCG GTTGTATCAA 
GCCGATTGGT TGCTGCGCTT TTATGGCTTT TCGGCTGAAG AAATTTTATC GGAGGAGTTG 
CCACATCTCG ATGAGCAATT CGATCCTAAA ACAGCGTGGG CGTTGCGTCA TCCCGAATTT 
TTTCCCGTTG ATATTAATCG TGCCGATTAC GCCACGCTCT TGCGGGTGCC GGGCATTGGC 
GTTACTTCCG CTAAACGCAT TGTTGCTGCT CGCCGCTTTT CGCTTATAAC GTTTGAAGGA 
TTGAAAAAAA TTGGGGTGGT AATAAAGCGG GCGCGTTACT TTATTACCAT GCAAGGGCGC 
CGTGTTGAGT GCACCGACTT TTCGCCAACG CTCATTCGTC GTCAGCTCCT TTTAAGCGAA 
TCCACAGAAA AGCCCGCTTC ACGGCAGCTT GTGCTCCCAG GACTTGAACC CATCCTCGCA 
TGA

Protein sequence

MDTLTKLRIL SGAARYDASC ASSGSNRSGA SCGIGNTSQS GICHSWSDDG RCISLLKILL 
SNDCCYNCAY CVNRATNPVE RASFTAREVV DLTLDFYRRN YIEGLFLSSA VMQSPDATME 
RMVAVAETLR SEERFGGYIH LKIIPGASSE LVRKAGLYAD RISVNIELPS QVSLERLAPQ 
KHRAAILEPM ALIGREINTS LVERQHSHRA PRFAPAGQST QMIIGATPES DFQILRLSQG 
LYKKMNLKRV YYSAYVPVSE DNRLPVLAAP PLLREHRLYQ ADWLLRFYGF SAEEILSEEL 
PHLDEQFDPK TAWALRHPEF FPVDINRADY ATLLRVPGIG VTSAKRIVAA RRFSLITFEG 
LKKIGVVIKR ARYFITMQGR RVECTDFSPT LIRRQLLLSE STEKPASRQL VLPGLEPILA