Gene Cag_1790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1790
Symbol
ID	3747210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2311272
End bp	2312963
Gene Length	1692 bp
Protein Length	563 aa
Translation table	11
GC content	49%
IMG OID	637774328
Product	hypothetical protein
Protein accession	YP_380084
Protein GI	78189746
COG category	[S] Function unknown
COG ID	[COG2989] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAATAC TTACCCGTTC CATGGTGCTA CAGCGTCAAG CATCGCCGTA TCAGTTTCGT 
TTTGCGTTGA TTCGATGTAT TGCGGTATTG ATGCTTTGTG CACCAATTTC TCTCTATGCG 
GCTGAGGAGG TGCAGCAAGC GGAATCAGCA GCGTGGAAGC GCGATGTAGC ATTGCGTCTT 
GAGAAATATT GTATTACAGT TTTTCGCTCG CCCGGTAGCG GTAAAACAAG AGAGAACAAC 
TTGCGCGTTG CTCGCTTTTA TGCCACTCGT AGTTACCAGC CACTTTGGAG TAGCACCACT 
ATGACGCAAG AGCTTGCCAC ATCACTTAAT GCCGCATTTG AACATGGTTT AACGCCTGCC 
GAATACGATG TTGCGGGTGA ACTTCCTCGT TGGATGGCGC TTACCAACCG CTCTGCTGCC 
GCGCAAGCTC GTTACGATGT GCTTGCCACG CGTGCGTTTC TTACGCTTGC CACGCACTTA 
CGCTACGGCA AACTCGACCC CGTGCGCTTT GAACCAACAT GGAATTTTTC GTCGCCACCA 
AATCTCTTTC ATTTTGATGA ACTGTTAGCA CGCACCTTGC AGCGCACCTC TCCAAGTGAA 
GTGCTCAATG GCTTGCTCCC GCGTGATCCG GGGTATGATG TATTGAAAAA AGAGCTGGCA 
CGTTACCGAG AAATAGCAAA AAATGGGGGA TGGTCCGCCA TTCCTGCGGG AACGCTTTTG 
CAGGAAGGAA GCCGTGATGC TCGTGTGCCG CTATTGCGCC AACGCCTTGC TGCTTCGGGC 
GATATAAGCT CAAGTGCGGT AGCTGATACC ACAACCCTAT ACAACCCTGA TGTAACAAAA 
GCCGTAAAGC GCTTTCAGCA ACAGCATGGT TTATGGAGTG ATGGAGTTGT TGGTGCTACC 
ACCTTACGCG CCATCAATGT AAGTGCAGAT GAACGAATTG GGCAATTGCG GGTTAATTTG 
GAGCGTTGCC GCTGGCTTTT GCATGATATT TCACCAACCT CCGTAATTGT TAACATTCCA 
GCATACACGT TGCACTATTT TGAGCAAGGC GATCGCCGCT GGAGTACTCG CGTCATTGTG 
GGGCAGCCCA AACGACCTAC ACCGGTGTTT CGTGCCGATA TGCAATTGCT TATTCTTAAC 
CCCCGCTGGG TAGTGCCCTC AACCGTTTTG GCAAAGGATG TGCTGCCCGC AGTTATCAAA 
GATCCTGCAT ATCTCCGCAA AAAAAAATTA CGAGTTGTTG ATGAAAATGG TACCATTATT 
GATCCAGCAA CCATTAAATG GTCAAGCTAT TCAGCCAGCA CCTTACCATA CCGTTTACAG 
CAAAAATCGG GGGATGATGG GGCGCTTGGA CGCATTAAAT TCCTTATGCC CAACCGCTAC 
ACCATCTATT TGCACGACAC TCCCGATAAA GCCTTGTTCC AAAAAACACA ACGCGCTTTT 
AGCTCAGGCT GTATTCGTGT GCAACACCCC GAAGAACTTG CTCGTCTTGT GCTTCGCCAT 
AGCAATCGAG AAAGTCGTCC CTCTCTTGAA AGCCGCATTA AAAGTGGTGC AACATCAACC 
ATTCGCCTTC CGCAACAAAT TCCCGTCTAT TTAATTTACC TGACGGCACT ACCCTGCAAC 
AACAAAGCTG AATTTCGAGA AGATATTTAT CATCGCGATC CTCAAATTCT TAAAGCGTTA 
GACGCGAAGT AG

Protein sequence

MAILTRSMVL QRQASPYQFR FALIRCIAVL MLCAPISLYA AEEVQQAESA AWKRDVALRL 
EKYCITVFRS PGSGKTRENN LRVARFYATR SYQPLWSSTT MTQELATSLN AAFEHGLTPA 
EYDVAGELPR WMALTNRSAA AQARYDVLAT RAFLTLATHL RYGKLDPVRF EPTWNFSSPP 
NLFHFDELLA RTLQRTSPSE VLNGLLPRDP GYDVLKKELA RYREIAKNGG WSAIPAGTLL 
QEGSRDARVP LLRQRLAASG DISSSAVADT TTLYNPDVTK AVKRFQQQHG LWSDGVVGAT 
TLRAINVSAD ERIGQLRVNL ERCRWLLHDI SPTSVIVNIP AYTLHYFEQG DRRWSTRVIV 
GQPKRPTPVF RADMQLLILN PRWVVPSTVL AKDVLPAVIK DPAYLRKKKL RVVDENGTII 
DPATIKWSSY SASTLPYRLQ QKSGDDGALG RIKFLMPNRY TIYLHDTPDK ALFQKTQRAF 
SSGCIRVQHP EELARLVLRH SNRESRPSLE SRIKSGATST IRLPQQIPVY LIYLTALPCN 
NKAEFREDIY HRDPQILKAL DAK