Gene Cag_1737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1737
Symbol
ID	3746520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2256164
End bp	2257660
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	46%
IMG OID	637774274
Product	hypothetical protein
Protein accession	YP_380031
Protein GI	78189693
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTATTA ATAAGGATTT GTTGGAATTT TTCGGTTCCA TGATGGAAAT CAAAAAGCAG 
AAGCGAGACA TTTTTAATGC TCTTGCGGCT GATGTTGATG ATCCCGAAAT CAGAAATACG 
CTGCTTCGTA TTGGTGCTGA TGAACAACGT CATGTTGATC AAATTCAGCA AAGCATAAAC 
TTAGTGAACA GCGGTTCTAC GGCAGAGCCT ATGGTTCCCG AAGCTGCACC AGCGCCACAA 
GTTGCGCCAG CTCCGGCTCC ACCTGCTCCA ACAATAGCGC CTGCTACATT GCAGCCTGCT 
ATTGCAATTG CTCAGCCAGC TATAGTGCGC CCCGAGCCAC CTCAGCCCGT TGCACCAATG 
CCTGTTCCCG AGCCAGTAGC AGCGCCGCCA ACGTACGTGC AACCTGTGCA ACCTATTGCT 
CAGCCAATTA CCCAACAAGT GGTGGTTTCG GAACCAGTAG CACCTACAGT TAGCCAATTG 
CAACAGCCAG CACCACCGCA GCCACTTACC TATTTAACAC CAACAATAGC TACACCAGCA 
GCTCCTGCTG AGCCCGCTTA CAGTGAGCCT GCTGAACAGT CTATTTCATC ATTTGCCAGC 
CCATTATCAT CTGGCACTCA ACGCTATCCG GTTCAGCCAC CCACCTCGAA AACTTTTGAG 
AACATGACAA CACTCCACCA TCCATTAGGG GAAGTTTTTG GTTTTGCAGC CACTGATCAA 
TCACCAAAAG CTCAGCGTTA TCGCTCACAT CGTCATTGCC CTTTTAACAA TAAGTCGCCA 
AACTGCACGA ACTCCCATAC CGAAAATCCT CTTGGTGTAT GTAGTATTTT GCATAATAAC 
AAAGCAATTA TTACCTGCCC AATTCGCTTC CGTGAAGATT GGCTTATTAC CGATGATGCA 
GCTTCCTTCT TTTTTGAGCC CGGTGTTCGC TGGAGTTCAT TAACCGATGT TCGTTTAGCT 
GATGCCAACG GTACTTCCGC TGGTAATATG GATGTTATGT TGGTAGCTTA CGATAAAGAG 
GGAAAAATTA TTGATTTTGG TGCTATTCAA ATTCAAACTG CTCACATTGA CGGTAATGTG 
CGTGAGCCAT TTGAATGTTA CATGAAAGAT CCTAAGACCA ATGCTATGAT GGATTGGACC 
CGTCAGCCAA ACTATCCTGA GCCCGACTTC CTTTCAGCAA TGCGCACCAG CGTTGTGCCT 
GAATTGCTTT ACAAAGGTGG TATTTTGCAC TCTTGGAACA AGAAGATGGC AATTGCTATT 
AACAAAAGCA TGTTTGAAAC CTTGCCACCA CTAACGCGAG TTAAAAAAGA TGAAGCCGAT 
ATTGCGTGGT TGCTTTATGA GCTTGAAGCG GTAAATGACG GTGAAAAAGA GGCTTATCAG 
CTTAAGAAAA GTGAAGTTGT TTATACTGCC TTCCAACCTA CCTTATTAGC TCTTACTGCC 
ATTGCTCCAG GTAATGTGAA TGACTTTATG AAGTTTATTC CCGAGCTTGG CGCCTAA

Protein sequence

MFINKDLLEF FGSMMEIKKQ KRDIFNALAA DVDDPEIRNT LLRIGADEQR HVDQIQQSIN 
LVNSGSTAEP MVPEAAPAPQ VAPAPAPPAP TIAPATLQPA IAIAQPAIVR PEPPQPVAPM 
PVPEPVAAPP TYVQPVQPIA QPITQQVVVS EPVAPTVSQL QQPAPPQPLT YLTPTIATPA 
APAEPAYSEP AEQSISSFAS PLSSGTQRYP VQPPTSKTFE NMTTLHHPLG EVFGFAATDQ 
SPKAQRYRSH RHCPFNNKSP NCTNSHTENP LGVCSILHNN KAIITCPIRF REDWLITDDA 
ASFFFEPGVR WSSLTDVRLA DANGTSAGNM DVMLVAYDKE GKIIDFGAIQ IQTAHIDGNV 
REPFECYMKD PKTNAMMDWT RQPNYPEPDF LSAMRTSVVP ELLYKGGILH SWNKKMAIAI 
NKSMFETLPP LTRVKKDEAD IAWLLYELEA VNDGEKEAYQ LKKSEVVYTA FQPTLLALTA 
IAPGNVNDFM KFIPELGA