Gene Clim_1572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1572
Symbol
ID	6354220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1691791
End bp	1693122
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	642669176
Product	hypothetical protein
Protein accession	YP_001943598
Protein GI	189347069
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000000183741
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAGC CTGAACGCCG GGATTTTTAT TCTTTTGCAC GTATTGTATC GCTGTTTCTC 
GGGATTTGCG GGCTCAGTGT GCTGAGCCTC TCTCTCTACT GGAGGGTTGT GGTGCCTGCT 
GAACCTCATA TGTCAATGCA TTTCAGTCCT GTTTACAAAG AGTTCGTTCT CAGCGGAAGA 
TGGAGCGGTT CAGTTCCGGA GCCGAATGAC GGACAGCGAT ACTGGAGGGA AGATGGATAT 
CCTCTCGGCA GGGAGCAGTA TCGTGCAGCG CTACCGTTTC TGTATGTCAG GGACCTTGTC 
AAGTGGGATG CGTTTCCTGA AACGATCGCA GGTTTGGCAG TTTCTCCGTT CGACGCTGAA 
CAGTCTTGGC AGTTCATGCG GCTGTTTTCC GAAGACTGGA ATGCTCCTCC ACCGATGCTG 
CATATGTTCA TTGAGTCGAA ACCTCATGGC GCAAGATTGC AGAAACCGGA TGATTTTTTC 
AGGGTTTCGT CATCCGGAAA CGGCATTGAA TTCCTGACGC CCCGTGAGGG TAAGGTGGAC 
AGTCTTAAAA GCAGCAGCTT TACCCGAGCC CTCCGCGCGG CAGGTTTTGT GTTTCCCGTA 
ATGGAGCTGG GTGGAAATCC TGATGTGAGA AAGCGGTATG ATGCGGGATA TTTTATTGCT 
GATTCGAAAG GGTTCTTGTT TCAGATGCAG ATGGTTGACG GACAACCATC ATGCCGGCGC 
CTGCAGCCGC AGATCAGCGG CAAGATAAGG TACATAGCTG TCAACGAGCA TCATCGCGAA 
GAGTTTTTCG GTTTTGTCGC AACCGATGAC GCCCTGTATG CCATCATGCA GAAGGAGAGA 
CGGCTCAAGC AGCTGCCGAT CGGGAAATTC GATGCCGATG CGCTCAGACT TGCGATATGG 
TCCGATATTC TCTACACCTC CGTGTTCATC GAGAGTCCCG GTATGCCGGG GTCGGGAATT 
GAAGGCATTG CCATGACCCC CGATTTCAAA GTTGTTCGTC GATACGTCCA GGCGCAGGAT 
TCGGACTATG CTGGTTCAAT GCGCCGGCTC GATACCATCG CCTCTTTTCT TTTCCCGCTG 
CAGATCGTCA GTGGAATACC GGGGTCTTCC TTCCGAGACA TGCGTGCAGG GCCAGGAGGA 
GATCTGTCGG CAGTGCTTGC CGGCAGCGTT TTCGCGCTTG TCGCTTTCAT ACGTGTTACC 
CGGTCAGGAT TCCGAAAGAG TGTGAGGCCG TGGAGCGATT ATGTGTTTGT CGCCGTTTTC 
GGTTTTGTTG CCATAGCGAT GATACTGATT GAAGACGCCG ACCAACATGT GCGGGTGCTG 
CATAACAGCT GA

Protein sequence

MGKPERRDFY SFARIVSLFL GICGLSVLSL SLYWRVVVPA EPHMSMHFSP VYKEFVLSGR 
WSGSVPEPND GQRYWREDGY PLGREQYRAA LPFLYVRDLV KWDAFPETIA GLAVSPFDAE 
QSWQFMRLFS EDWNAPPPML HMFIESKPHG ARLQKPDDFF RVSSSGNGIE FLTPREGKVD 
SLKSSSFTRA LRAAGFVFPV MELGGNPDVR KRYDAGYFIA DSKGFLFQMQ MVDGQPSCRR 
LQPQISGKIR YIAVNEHHRE EFFGFVATDD ALYAIMQKER RLKQLPIGKF DADALRLAIW 
SDILYTSVFI ESPGMPGSGI EGIAMTPDFK VVRRYVQAQD SDYAGSMRRL DTIASFLFPL 
QIVSGIPGSS FRDMRAGPGG DLSAVLAGSV FALVAFIRVT RSGFRKSVRP WSDYVFVAVF 
GFVAIAMILI EDADQHVRVL HNS