Gene Cag_1064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1064
Symbol
ID	3746718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1446707
End bp	1447933
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	51%
IMG OID	637773595
Product	molybdopterin binding domain-containing protein
Protein accession	YP_379369
Protein GI	78189031
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAACCG TTGAAGCTGC ACGCACACTT GTTCAACAAT CCATTCAACC GCTTGGCACC 
GAGCAGTTAC CCATTGCCGA AGCGTTCGGA CGCATTACCG CTGAAGCAAT TCATGCGCCT 
TTTGCATTGC CACGTTTTAC CAATGCCGCT ATGGATGGCT TTGCTGTGCG TTGGGACGAT 
ATTGCACAAG CATCCGACGC CACGCCAATA ACGCTTACCG TGCAGGAGAT GATTGCTGCT 
GGCAGTGAGC CCACTGTGGC AATTTCGCAA GGTTGCTGCT CAGCAATTAT GACGGGTGCT 
CCAATGCCGC AAGGGGCTGA TACAGTAGTT CCCTTTGAGC AAACAAGCGG ATTTGGCAGC 
AACAGCGTTA CCATTTTTAA AGCCCCAAAG CGTCAAGCCA ATGTGCGCTA TGCAGGCGAA 
GAGGTGGCGG CGAATGAATT GCTGGTGGAG AATGGAGTAG CACTAAATCC TGCTGCACTA 
TCGGTGCTTG CAAGCTTTGG GGTTGCTCAA TTGAAGGTTC GTCGTCAACC ACGAATTGCC 
ATTATTACCG TAGGAGACGA AGTGCAACTA CCGGGGAAAC CCTTAATAGG CGCTCAAATT 
TACAACTGCA ACCGCTTTAT GCTTGATGCC GCCTGCCGTT CACTTGGCAT AATTCCAACC 
TTTATTCACC ACGCCCCCGA CAACCGCGAA GTATTACGCC ATTCGCTTGG CATGGCGCTC 
ACCATGTGCG ATATGCTCCT TACGGCTGGA GGCATTTCAA CAGGAGAATT TGATTTTGTA 
CAGAGCGAAT TAACAGCGCT TGGAATCAAC AAACATTTTT GGAGCATTGC CCAAAAGCCG 
GGTAAACCGC TCTACTTTGG CACCTCACAC GAAGGCAAAG CCGTATTTGC GTTGCCGGGC 
AATCCCATTT CAGCCATTGT TTGCTTTGCC GCTTACGTGG TTGACGCACT TGCCCTGATG 
CAAGGCAAAA CCCTCAGCAC ATCACGCTTT ACCGCAACCC TTGCCGAACC ATTCCCCACC 
GATAAAAAAC GCTACCGCTT TTTACCCGGT ATGGTGTGGG TGGATCGTGG GCAACTCTTT 
TGCAAAGCCG CAAGTAAGAT AGAATCGCAC ATGATTACTT CACTTTCGGG AGCAAACTGT 
TTACTTGAAG CCGAAGCCGC TCAATATGAC CGTCCTGCTG GCGAGCTTAT TACTTGCACC 
ATGTTGCCGT GGGGGAAGGT TTGTTAA

Protein sequence

MITVEAARTL VQQSIQPLGT EQLPIAEAFG RITAEAIHAP FALPRFTNAA MDGFAVRWDD 
IAQASDATPI TLTVQEMIAA GSEPTVAISQ GCCSAIMTGA PMPQGADTVV PFEQTSGFGS 
NSVTIFKAPK RQANVRYAGE EVAANELLVE NGVALNPAAL SVLASFGVAQ LKVRRQPRIA 
IITVGDEVQL PGKPLIGAQI YNCNRFMLDA ACRSLGIIPT FIHHAPDNRE VLRHSLGMAL 
TMCDMLLTAG GISTGEFDFV QSELTALGIN KHFWSIAQKP GKPLYFGTSH EGKAVFALPG 
NPISAIVCFA AYVVDALALM QGKTLSTSRF TATLAEPFPT DKKRYRFLPG MVWVDRGQLF 
CKAASKIESH MITSLSGANC LLEAEAAQYD RPAGELITCT MLPWGKVC