Gene Plut_2055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plut_2055
Symbol
ID	3746197
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium luteolum DSM 273
Kingdom	Bacteria
Replicon accession	NC_007512
Strand	+
Start bp	2284867
End bp	2286003
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	61%
IMG OID	637770086
Product	glycosy hydrolase family protein
Protein accession	YP_375940
Protein GI	78187897
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAGA GGGTCCCCGT CTTTCTTGCG CTGCTGCTCT TCGCCCTCCT CCTCCAGCCA 
CCGCCCATCG CAGAAGCGGG AACGAAGCCG GACAGCCTAT CCATTAAAAT CGGCCAGATG 
CTGATGGTGG GCTTCAGGGG CACCACCATC GGCGATGCCC CTGACGTACG GCGCGCCATC 
GACCGCCAGC GCATCGGCGG CGTGGTGCTC TTCGACTATG ACGTCCCGTC CCGGACCCCG 
CTTCGCAACA TAACCGGCCC GGAACAGCTT CAGCGGCTGA ACGGCGAACT GCAGGAGCGT 
TCCCCCGTCC CGCTCTTCAT TTCGATCGAC CAGGAAGGCG GCATGGTCAG CAGGCTCAAG 
CCGGCAAGGG GGTTCCCCCG GAGCCCGAGC GCCCGGAGCC TCGGACTGCT CAGGAACCCC 
GACAGCACCC TCGCTGCAGC GGAGGTGACT GCCCGGACAC TGCAGTCGAT GGGAGTCAAC 
ATGAACCTTG CGCCGGTGGT CGACCTTGAT ACCAACCCGC AGAATCCCGT CATCGGCCGT 
ATAGAGCGGA GCTACTCGCC TGACCCCGAC ATCGTCTCGT CTCAGGCCGC CATCGTCACA 
ACGACCTTTC TCCGCGAGGG GATCATCCCT GTCCTGAAAC ATTTTCCCGG CCACGGCAGC 
TCGACCTCGG ACAGCCATCT GGGCTTCACC GACGTAACGG AAAGCTGGAG CGAGATTGAA 
CTTGAACCAT ACCGCAGCCT CTTGCTTGAT GGATATCAGG GTGCCATCAT GACCGCCCAC 
GTCTTCAACG CCCGCCTCGA TCCCCGCTAT CCGGCGACCC TTTCAAAGGC GACCATCAGC 
GGCCTACTAC GAGAAAAGCT CGGGTTCCGT GGGGTGGTGC TTACCGATGA CATGCAGATG 
GGCGCCATTG CCCAGAACTT CGGCTTTGAA GAAGCGGTCC GCCTGTCGAT TGAAGCCGGT 
GCTGACATTC TTGTGTTTGC CAACAATACG GCCGTCTACG ACCCAAAAAT CGCAGAAAAG 
GCATCAGGCA TCATCCGCAG GATGGTGGAT GAGGGCATAA TTTCTCCCCT TCGCATCGAG 
GAGTCGTACC GGAGGATCAT GACACTCAAA GAGACTGTAA CCCACCCTGC CAGATGA

Protein sequence

MSQRVPVFLA LLLFALLLQP PPIAEAGTKP DSLSIKIGQM LMVGFRGTTI GDAPDVRRAI 
DRQRIGGVVL FDYDVPSRTP LRNITGPEQL QRLNGELQER SPVPLFISID QEGGMVSRLK 
PARGFPRSPS ARSLGLLRNP DSTLAAAEVT ARTLQSMGVN MNLAPVVDLD TNPQNPVIGR 
IERSYSPDPD IVSSQAAIVT TTFLREGIIP VLKHFPGHGS STSDSHLGFT DVTESWSEIE 
LEPYRSLLLD GYQGAIMTAH VFNARLDPRY PATLSKATIS GLLREKLGFR GVVLTDDMQM 
GAIAQNFGFE EAVRLSIEAG ADILVFANNT AVYDPKIAEK ASGIIRRMVD EGIISPLRIE 
ESYRRIMTLK ETVTHPAR