Gene Clim_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2043
Symbol
ID	6355548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2253203
End bp	2254252
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	50%
IMG OID	642669639
Product	OmpA/MotB domain protein
Protein accession	YP_001944051
Protein GI	189347522
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2885] Outer membrane protein and related peptidoglycan-associated (lipo)proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0433092
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACATC AGGATTCACG TTCGCGTTCC ATATTCTGCC GGATGGGCAG GATTCTTATG 
TTTTTGCCGC TTTTTGTGCT TTTTTTGGCA GGAACGGATC TTTCAGCAGC CGATCTTCCG 
GGTTCGAAAG ACAATCCGTT GCTGAAGCGG TTTGCCGGTT CGGAAATTGT CGGTTATCAC 
GCAAAGAGCT TCGATGAATA CGAGCTTCAG ACCTCTACGT TCATTCGTTA CAATTTCGAA 
ACCAGAAAAC GGGATTATGC AAAACCGCCG CTTAAACCGG AAGGCCGGCT GACGAGAATC 
TGGTACGAGG CGGCCGGAGA TACCGGTTCG CTGGAAGTTT ACCGGAATTA TCTCAATGAA 
CTGCGATCGA ATGGCTTCGT CATTCTCTAT GATTCCAAAA AAGATCCCGC GGCGACAAAA 
TGGACGAACT ACCTTGCTCC TTTCGGATCT GTCGATCTTA CCACCAACAG AAGCAAGTAT 
GTTTTTTTCG CTGCCGAGAA AAACGCTATC TGTGTTGCAA GCGCCAAAAA GAAGCGGCCT 
GAAGGGGATG TTTATGTTTA TCTGACCGTT ATCGAATGGG GAAAGGATGA TTCGGTCTAT 
AAGGCCAGAC GCGGAGCCTA TGCGGCGGTC GATATCATCG AAACCAGGCC AATGCAGCAG 
AAAATGGTTA CGGTTTCTGC AGATGAAATG TCGCGCTCCA TCACTTCGAC CGGCAAGGTC 
TCTCTTTACG GCATTTATTT CGATACCAAC AAGGCGGATA TAAAACCGGC CTCGAAACCA 
GCTCTCGGGG AGATCGCAAA ACTTTTGAAG AAACAGCCGG CAATGAAGCT TCATGTTGTA 
GGCCATACCG ACAATGCCGG TGGCTACGAA TTCAATGTAT CGCTTTCGAA ACGCAGGGCC 
GATGCAGTGG TCGGTGTGCT GCAGAAAGAG TATGGTATCG CTCCCGGTCG CCTGACCGCC 
AATGGTGTGG CCTATCTCGC TCCCGTTGCT TCCAATGCGG CTGAAGCCGG AAGGGCGAAA 
AACCGTCGCG TCGAACTGGT GCCGAGATAA

Protein sequence

MKHQDSRSRS IFCRMGRILM FLPLFVLFLA GTDLSAADLP GSKDNPLLKR FAGSEIVGYH 
AKSFDEYELQ TSTFIRYNFE TRKRDYAKPP LKPEGRLTRI WYEAAGDTGS LEVYRNYLNE 
LRSNGFVILY DSKKDPAATK WTNYLAPFGS VDLTTNRSKY VFFAAEKNAI CVASAKKKRP 
EGDVYVYLTV IEWGKDDSVY KARRGAYAAV DIIETRPMQQ KMVTVSADEM SRSITSTGKV 
SLYGIYFDTN KADIKPASKP ALGEIAKLLK KQPAMKLHVV GHTDNAGGYE FNVSLSKRRA 
DAVVGVLQKE YGIAPGRLTA NGVAYLAPVA SNAAEAGRAK NRRVELVPR