Gene Clim_2181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2181
Symbol
ID	6355975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2419916
End bp	2421046
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	49%
IMG OID	642669772
Product	protein of unknown function UPF0118
Protein accession	YP_001944184
Protein GI	189347655
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.00612132
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGCAT ATGAAAAGCA AACGATCAAC AAAACAGGGA TGACGATGAA CAGGTTTACT 
GCCAGCAAGG TTGTGCTTCT CTTGATTGTC TTTGTGATCT CGGCGCTTTT TTTTGCCATG 
ATCCGGTATT TTTTCATGGC GATTTTTCTT GCGGCAATTT TTTCGGCATT GTCCATGCCG 
ATTTACAGCC GGATCGAGCG ATTTGTAAGA GGACGGAAAA ATCTGAGCTC GGCATTGACC 
ATGATTTCGC TTTTTATCAT GGTTTTTCTT CCGTTTACGG CAGTTATGGG CATTGTCGCC 
GTTCAGGCCG TCAACATCAG CCGGGCGGCT GTGCCGTGGA TTCAGGCCCA ACTCAAGGAA 
CCGGCCACGT ATAACACCAT GCTGCAGTCG TTTCCCTATT ACCGTGAACT GGAACTGTAT 
CGCGAAGAGA TTCTGCAGAA AGCGGCCGAA TTGGCCGGGA CTGCCGGGAC TTTTCTCTTT 
AACAGTCTTT CGTCGATTAC CGTGACAGCG ATGAACGAGC TTTTTCTGAT GTTCATTTTT 
CTCTATACCA TGTTCTTTTT TCTCAAGGAT GGAAGGCTTC TGCTTGAAAA AATCATGTAC 
TATGTTCCTT TGGATGAGTC GGATCAGTAT CGTCTGCTTG ACCGTTTTCT TTCGGTAACC 
CGGGCAACGC TCAAGGGAAC CATGGTTGTC GGTCTTATTC AGGGATCCGT TGCCGGTCTG 
GCCCTGCATC TTGCCGGCAT CGAAAGCGCT CTGTTCTGGG GAACGATCAT GAGCGTGCTT 
TCGGTCGTTC CGGTGCTCGG TCCTCCGCTT GTCTGGCTGC CGGCGGCAAT CTATCTTGCT 
GTAACAGGTC ACTATACCGA AGCGGCAGCT GTTTTTCTTT TCTGCAGCAT TATAGTCAGT 
CAGCTCGACA ATGTGCTTCG TCCCATTCTC ATCGGTCGCG ACACGCAGAT GCATGAGCTT 
ATGATCTTTT TCGGTACCCT CGGTGGTCTG GGGTTGTTCG GCCTTTTCGG TTTTATTATC 
GGCCCGATTG TAGCCGCTCT GTTCATTACC GTTTGGGAAA TCTACGGTGA GACATTCAGC 
GATTACCTGC AAGAGGTGAA GCGGAAGAGT GAGCGTCGTA TCGATAGTTG A

Protein sequence

MAAYEKQTIN KTGMTMNRFT ASKVVLLLIV FVISALFFAM IRYFFMAIFL AAIFSALSMP 
IYSRIERFVR GRKNLSSALT MISLFIMVFL PFTAVMGIVA VQAVNISRAA VPWIQAQLKE 
PATYNTMLQS FPYYRELELY REEILQKAAE LAGTAGTFLF NSLSSITVTA MNELFLMFIF 
LYTMFFFLKD GRLLLEKIMY YVPLDESDQY RLLDRFLSVT RATLKGTMVV GLIQGSVAGL 
ALHLAGIESA LFWGTIMSVL SVVPVLGPPL VWLPAAIYLA VTGHYTEAAA VFLFCSIIVS 
QLDNVLRPIL IGRDTQMHEL MIFFGTLGGL GLFGLFGFII GPIVAALFIT VWEIYGETFS 
DYLQEVKRKS ERRIDS