Gene Clim_0810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0810
Symbol
ID	6353880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	887304
End bp	888506
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	50%
IMG OID	642668434
Product	internalin-related protein
Protein accession	YP_001942869
Protein GI	189346340
COG category	[S] Function unknown
COG ID	[COG4886] Leucine-rich repeat (LRR) protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.448764
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAGCAGA ACACCTACAG CAATTGCCCG ATATGCGGTT TCCCGCTCTC CTCGGAGAGT 
GCGGTCTGCC CCCGGTGCGG TAACGATATT CTCGAAGACA TCAACTCTCT TGACGAGCAG 
AGCATGGACC TTCATCGTCA CAATATCGAA GAAAAAAAGG CTGCCTGGTA CACGCGCTGC 
ATAACGGAAA ATCTCGGGTT CTGTGAAAAT CCGGTTGAAG AGTCATGCCC CGATACAGCG 
AAAATATCCG GAACACGACA CCTCTACTGC AGTTCGGAAG AACGTGAATT TCTGGGTACC 
TGTAACAGGT CCTCCCTTGT CGATGACAGC TCGCTCCGCA GGAAATGGTG GAACTGTCTT 
ACAGCCGACT GGAAAGAGGT GGTCAAAAGC ACCATAAAAC TGGTACGCGA TCCCTCCGAG 
AGCGAACTTC TCGATTTTTT TCAAACCACT CATCTGCGCT GCGATAATCG CCGCGTGCAC 
GATCTTCTCC CGGTACGCAT GCTCGAGCAT CTCCAGCAGC TGCGCTGTGA TGAATCGCCG 
GTGGAGAATC TCGAACCCAT TGCGAATCTC ATCCATCTGC AGCGTCTCTA TGCGTTCGAC 
TGTGATATCG CGTCTCTCGA ACCTCTGCGC AATCTCCGGA ATCTGAAACT GCTCTGGATA 
TCGAGTACTC AGATAACATC GCTGGAGCCA TTGAAAAATC TGGTCAATCT TGAAGAACTG 
TACTGTTCGG AAACCATGAT TACCGACCTC TCACCCCTGC AATCGATGCT CTCGCTTGAG 
AAGCTCAGCT GCTATAAAAC GGAAATCACC AATCTCGATC CCTTGAGATC TCTTGAAGAT 
CTCATCGAAC TCGGCATCAA CAACACGGGT ATTGACGATC TGGCTCCACT TGCCGGTCTG 
CGTAATCTCG AGTACCTTCG CTGCAGCAAA ACCAACATAG CAAGCCTTGA TCCTCTAAAA 
AATATCATCG GGCTGAGAGA ACTCAATGTC TCAAAAACAA AGATATCCTC GGTCGAACCG 
CTTGCAGGTC TCGTTGATCT CGAGGAACTC GATATTTCGC ATACTCTTGT ACGCTCAATA 
GAGCCGCTCA TGCATCTGGA AAGTTTCGAA AAGCTCGAGC TTTTGGCAGG CCAGATTCCC 
GATATGGAGA TCGAACGGTT CATTGAACTG CATCCCGGCT GTGAAGTCCT GCTGAAAAAC 
TGA

Protein sequence

MEQNTYSNCP ICGFPLSSES AVCPRCGNDI LEDINSLDEQ SMDLHRHNIE EKKAAWYTRC 
ITENLGFCEN PVEESCPDTA KISGTRHLYC SSEEREFLGT CNRSSLVDDS SLRRKWWNCL 
TADWKEVVKS TIKLVRDPSE SELLDFFQTT HLRCDNRRVH DLLPVRMLEH LQQLRCDESP 
VENLEPIANL IHLQRLYAFD CDIASLEPLR NLRNLKLLWI SSTQITSLEP LKNLVNLEEL 
YCSETMITDL SPLQSMLSLE KLSCYKTEIT NLDPLRSLED LIELGINNTG IDDLAPLAGL 
RNLEYLRCSK TNIASLDPLK NIIGLRELNV SKTKISSVEP LAGLVDLEEL DISHTLVRSI 
EPLMHLESFE KLELLAGQIP DMEIERFIEL HPGCEVLLKN