Gene Clim_1898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1898
Symbol
ID	6354952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2101157
End bp	2102251
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	43%
IMG OID	642669496
Product	hypothetical protein
Protein accession	YP_001943910
Protein GI	189347381
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.521574
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAAAT TATTCGAATT AAAGAAATAC TACAAACATG AAGGACTGAT TCAGTCTCTC 
ATTCATTTGT ACTGGCTGGT TTCTGCCAAG ATAAGTTATA AGCTTAACGA ACGCAAAGAA 
CGCCGAAAGT GGGAACAGAT TCCGGTGGAT ACCAGTAAAC GGGTCTTTGT AATTGGTAAC 
GGACCCAGCC TGAACATTAC TCCTCTGCAT CTGCTGGATC AGGAACAGAC TATTTGTTTT 
AACCGTTTTA CGCTCTTTTT AGATCGGATA CAGTGGAACC CGACCATGTA CATGATCATG 
GATGGTTTGG TCGGAAAAGA TATTATTGAG GATATCAAAA CGATGGTCGA TCGTACCCAA 
GTCTCTTTCG TTCCGGCTTT CGTGCCAAAA TACCGGGTCA ACTTCAAAAA GCATATTAAG 
AGCGAAAAGG TAAGATGGGT CTACCAACGT GGAAAGAAAA TCGAGCTGGC AGATCCGCCC 
TACGTGAATG TAAGCAACTC GGTTGCTGTA ACCGCGCTGC GTATTCTGAT CAAGCTTGGT 
TTCAAAGAAA TCTATCTGAT CGGAATGGAT ATGAACTATC AGATCCACAA AACCGCCAGC 
ACGCTTAAGA ACAACGATAT ACAATCTGTC AAGAACGACG ATCCGAATCA TTTTGATCCC 
CGCTACTTTG GTAAAGGAAA GAAGTATCAT CAGCCCAATG AGGAAGTAGT GCAACGTATC 
TTTAACTCAC TGACCGAGAT TGGTACACTG GCCGATAAAT ACGGCTCCCA AATCAGGAAT 
GCAACTCTTG GAGGTATGCT GGAAGTATTC CCCCGGATAG ATTTAAGAAG CCTGTTCCCG 
GAGTTTGAAG CTGAAGAATT TGTCAAACTG CAGGAGTTGA TCAAATTCCG AGCTGGATTC 
GAGCTTGAAT CAGCGGATCA CTGGGACAGT ATTCCCCAGG TTGATTCAAT TGATGCGGTC 
AGTGAGCATT TGGAAATGTT TCGGGTCGAT ACTGAGCTTA CACATTCATT CCTGAATAAA 
TTCATATTTG ATTATAACCT GTTCGGACCA TTCCGGCATC AAAAACTATT CATTAAAAGA 
AAGCAAAATG GCTAA

Protein sequence

MGKLFELKKY YKHEGLIQSL IHLYWLVSAK ISYKLNERKE RRKWEQIPVD TSKRVFVIGN 
GPSLNITPLH LLDQEQTICF NRFTLFLDRI QWNPTMYMIM DGLVGKDIIE DIKTMVDRTQ 
VSFVPAFVPK YRVNFKKHIK SEKVRWVYQR GKKIELADPP YVNVSNSVAV TALRILIKLG 
FKEIYLIGMD MNYQIHKTAS TLKNNDIQSV KNDDPNHFDP RYFGKGKKYH QPNEEVVQRI 
FNSLTEIGTL ADKYGSQIRN ATLGGMLEVF PRIDLRSLFP EFEAEEFVKL QELIKFRAGF 
ELESADHWDS IPQVDSIDAV SEHLEMFRVD TELTHSFLNK FIFDYNLFGP FRHQKLFIKR 
KQNG