Gene Cag_1857 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1857
Symbol
ID	3747010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2365057
End bp	2367453
Gene Length	2397 bp
Protein Length	798 aa
Translation table	11
GC content	46%
IMG OID	637774395
Product	hypothetical protein
Protein accession	YP_380151
Protein GI	78189813
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC AGATTTTGTT GTTCTCAGCC ATTTTTAGCG GCTATACCTT CTTGCTCCTT 
TTGCTTTACT TTCCGTTAGT CTTTCAATCG CAAGTGCTTA CAGCCCCCGA TTCGCTTATC 
CCACAAGCCT CATCCATGGC GCTTGATAAA CTCCAAGCTG AAAGCGGAAG CTATCCGTTG 
TGGCAGCCGT GGATTTTTTC AGGAATGCCA ACCGTTGAAG CCTTTAGCTA TCTCAGCGGG 
CTTTACTATC CCAATTTGTT GTTCAATCTT TTCCATACTG ATGGTGTGCT TCTCCAGCTT 
CTTCATCTTG CTTTTGCGGG TGCAGGTACC TTCCTTTTGT TGCGCGATTT ACGTCTCTCC 
TTGCTTGCCT CCATTGCTGG GGGATTGATC TTTCTCTGTA ATCCCTTTTT TAGCGCCATG 
CTTGTGCATG GGCATGGTAG TCAGCTTATG ACCACTGCAT ATATGCCGTG GATGCTATGG 
GCAGCAATGC GCTTTATGGA TCGTGGTGGC GTTGCTGAAG CGGGCATTTT TGCACTGATT 
GCAGGCTTGC AATTGCAGCG AGCGCATGTG CAAATGGCTT ACTATTCGTG GCTTATGATG 
CTGCTTTTGG TGGTTGTGTT GTTTGCAACA CGTCGTTGGG TTGTGCCACA AGCTGTGCAA 
CGGGGTGGGC TTTTCGTAAT TGCTTCAGTA ACGGCAATTG CTATGGCTGC CGCAATTTAT 
TTACCAGCCT CGCACTATGC TGAAGCCTCC GTGCGTGGTG CGGCAGTAGG TGGTGGTGGC 
GCTGCGTGGG AATATGCAAC GCTTTGGTCG CTTCATCCAC TTGAAGCAAT AACCTTCCTT 
TTCCCGGGAT TTTTTGGTTT TGGTGGTGTT ACCTATTGGG GCTTTATGCC CTTTACCGAC 
TTTCCACATT ACGCAGGTCT TGTGGTGTTA CTGCTTGCTC TCATGGGGCT AATTATGCGC 
CGTCGTGAAC CTATGACGTG GCTTTTTGCG GGCGTTGGCT TCCTTGCTCT TTTGCTTGCT 
TTCGGACGAT TTTTTAGCCC AATCTTCGAC CTCTTTTATT CGTTTGCACC GCTTTTTAGC 
CGCTTTCGTG TTCCTTCAAT GGCGCTCATT ATGCTCTATT TTGCGCTTGC TGCACTTGCG 
GCTATTGGTT TGCATGAATT GCTTGAGCGT AAACCACAGC GCTTGCTCAA AGTGCTTCGA 
CTTAGCAGTA TAGTTGTAGC GCTTCTATTG TTGATTTTTT TAGCCTTAGA AGAGGTTGCT 
GAACATGCAG CACGTTCACT TTTTCCGCTC CCGCAAGTTG ATAGCTTTGA GTTAGTCTCT 
GCCATTAATT CTATACGATG GGAACAACTT TCAAGCAGTG TTATTGTAAC TCTTACTCTT 
TTACTGCTTG TAGCAGGTGT TTTGTGGCTT TTACTGAGTG GCAAAATTTC TTCAAAATAT 
TCGGCATCGC TCCTTGTGTT GCTTGCTGTG GGTGATCTGC TGTGGGTTAC GGTTCAAGTT 
ATTTATCCAT CAGCTCACTC ACTTCGTACT CCGCTTTTTG CCGATAAGCA ACAAGTTGCA 
CCAGCATTTC AGCATGATGA TGTTACCCGT TTTCTTGCAA GTCAGCCCAA ACCCTTTCGT 
ATCTATCCTG CGGGTAACTT CTTTACAGAA AATAAGTTTG CCCTTTTTGG AATTGAATCG 
GTGGGTGGTT ACCATCCTGC CAAGCTAAAA AGCTACGATG ATCTATTGCA GGTGAGCGAT 
AATCTTGCAA GTATTGCCCT CTTGCGTATG CTTAATGTTC ACTACATCGT TAGCCCCGCA 
CCAATTGAGC ATCCCACACT TACATTGGCA ACAAGCGGTA CCTTGCAGCG TGCGAATGGT 
TCAGCTCAAG CCTTTGTTTA TCGCTTGCAA GAGCCAGCAC CACGCGCATG GTTTGTCAGC 
CGTGTTGTGC CATTTTCCAA CAAGCAAGAG CTATACAGCC ATTTGCTTGA TGATACTGCT 
TCGCTTTCAG TGGCTTACGT TGAAGCGCAG CAATGGCAAG GCGCACAACG TTTTTCAGAA 
GGCACCATTC AATCCGTTAC CACACAACCC GAATCCATTA AGCTTAATGT TAACGCACCA 
AATAGTTCCT TTTTAGTGCT CAGTGAAATC TACTATCCCA ACGGTTGGCA GGTAATGCTT 
GATGGTAAAG CAACTTCCAT GCTTCGGGTT AATGGCGTGT TGCGAGGGGT TAACGTACCG 
GCAGGTAACC ATGCTATCCA CTTCAGTTAC AATCGCCATT TATTTGAGCA AAGCCAATGG 
ATTGCTCTTG CGGGATTTAT TATTGCACTG CTGATGATTG CGGGTGGCTT GCTTTGGAAG 
CATCTTCTTC TTTCAGGTGA AAAACGGGTT GTAAGAGGTT TTCATACAAT AAGATAA

Protein sequence

MKKQILLFSA IFSGYTFLLL LLYFPLVFQS QVLTAPDSLI PQASSMALDK LQAESGSYPL 
WQPWIFSGMP TVEAFSYLSG LYYPNLLFNL FHTDGVLLQL LHLAFAGAGT FLLLRDLRLS 
LLASIAGGLI FLCNPFFSAM LVHGHGSQLM TTAYMPWMLW AAMRFMDRGG VAEAGIFALI 
AGLQLQRAHV QMAYYSWLMM LLLVVVLFAT RRWVVPQAVQ RGGLFVIASV TAIAMAAAIY 
LPASHYAEAS VRGAAVGGGG AAWEYATLWS LHPLEAITFL FPGFFGFGGV TYWGFMPFTD 
FPHYAGLVVL LLALMGLIMR RREPMTWLFA GVGFLALLLA FGRFFSPIFD LFYSFAPLFS 
RFRVPSMALI MLYFALAALA AIGLHELLER KPQRLLKVLR LSSIVVALLL LIFLALEEVA 
EHAARSLFPL PQVDSFELVS AINSIRWEQL SSSVIVTLTL LLLVAGVLWL LLSGKISSKY 
SASLLVLLAV GDLLWVTVQV IYPSAHSLRT PLFADKQQVA PAFQHDDVTR FLASQPKPFR 
IYPAGNFFTE NKFALFGIES VGGYHPAKLK SYDDLLQVSD NLASIALLRM LNVHYIVSPA 
PIEHPTLTLA TSGTLQRANG SAQAFVYRLQ EPAPRAWFVS RVVPFSNKQE LYSHLLDDTA 
SLSVAYVEAQ QWQGAQRFSE GTIQSVTTQP ESIKLNVNAP NSSFLVLSEI YYPNGWQVML 
DGKATSMLRV NGVLRGVNVP AGNHAIHFSY NRHLFEQSQW IALAGFIIAL LMIAGGLLWK 
HLLLSGEKRV VRGFHTIR