Gene LGAS_0195 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	LGAS_0195
Symbol
ID	4440333
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Lactobacillus gasseri ATCC 33323
Kingdom	Bacteria
Replicon accession	NC_008530
Strand	-
Start bp	227209
End bp	228639
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	38%
IMG OID	639672056
Product	cellobiose-specific PTS system IIC component
Protein accession	YP_814044
Protein GI	116628872
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00359] phosphotransferase system, cellobiose specific, IIC component [TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0622401
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.284293
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGAAC AGAAAAAATC GGGCTTTAGT GTTTTCGTTA ATAAACACAT CTTGCCCCCA 
GTAATGAAAT TTGTTAACAC CAAGGCCATC CAAGCCTTGC AAAATGGTAT GATTTACACT 
TTACCATTTA TCTTAATCGG TTCTATCTTC CTTATTCTAG GAAATATTCC AATCAAATCA 
GTAGCTGATG CAATCAATGC TTCTGGTTGG GGAGCATTCT TTAACCAAGC CTACACTACT 
ACTTTTAGTA TCATGGCTAT GTGGGCATCT GTTGGTATCG CCTATATTTA TGTTAAAAAT 
GAAGGCTATG AGCCATTAGC TCCCGGTCTT ACTTCTTTAG CATCATTCTT AATGCTTCAA 
ACTTTAACTA TTGACAGTCC ATTAAAGAAT GCCATGGCTA AAGGTATCGA CGGTCAAATG 
ACTGCTAAAG CTGTAACCGA AAATATTGAC AAGTTACCAC ATGCTTTACA AAGTTTCTTA 
GAATCCCCAG TTACAGGCGT ATTTAATATT ACCTGGCTTG GCGGAGACGG TATGATCGCC 
GCAATTATTG TTGGTTTATT AGTCGGCTGG ATTTATTCAG CTATTATGAA AAAAGGCTGG 
ACTATTAAGT TGCCTGAACA AGTTCCAGCA GCTGTTTCTA ACCAATTTAC TGCTATGATT 
CCATCAGGAA TGATCTTAAT TGGTACTATG CTTATTTACG CAGGCTTCAA GCTAACCACT 
GGTTCAGACT TCTTACAATG GACCTACCAA ACCCTTCAAA TTCCACTTCA AGGTATCTCT 
GATTCACTTG GTGGTGCAAT TGCCATTGGA TTCTTAGTCC CATTCTTCTG GTTCTTCGGT 
GTCCATGGTG GTTTAATTGT TGGATCCTTA GCTGGTCCTA TGCTTCAAGC AAACTCATTT 
GATAATGCAC AATTATACAA GGCCGGCAAG TTAACTATTG CTAATGGTGC TCACGTTGTT 
ACTAATGAAT TCTACAATAA CTTCATTAAC TTAACTGGTT CAGGGATTAC TATTGGTTTA 
ATTATCTTTA TCTTAATTGC TGCTAAATCA GCACAATTAC GTTCAATTGG TAAAGTTGAA 
TTAGTTCCTG GTATCTTTAA CATTAACGAA CCATTCCTAT TTGGTTTACC AATTGTTATG 
AATCCATTCC TTGCAATACC ATTCTTCTTA ACTCCAGTTG TAGTTGCTAT TTCAACTTAC 
TTCGTAATTA AAACTGGTAT TGTTCCTCCT CTAAATGGTT TTGCCTGTCC ATGGACGATG 
CCAGCAGTTA TTTCTGGCTT CCTAATTGGC GGCTGGAAGA TGGCAATTTG GCAAGCATGT 
ACCTTAGTAA TTTCAACCTT AATTTACTGG CCATTTGCTA AGAAATACGA CAACATTCTT 
GTTAAACGTG AAGCTGCTAC TCTCAAGAAA GACGAGGCTG AAAGTAAATA A

Protein sequence

MSEQKKSGFS VFVNKHILPP VMKFVNTKAI QALQNGMIYT LPFILIGSIF LILGNIPIKS 
VADAINASGW GAFFNQAYTT TFSIMAMWAS VGIAYIYVKN EGYEPLAPGL TSLASFLMLQ 
TLTIDSPLKN AMAKGIDGQM TAKAVTENID KLPHALQSFL ESPVTGVFNI TWLGGDGMIA 
AIIVGLLVGW IYSAIMKKGW TIKLPEQVPA AVSNQFTAMI PSGMILIGTM LIYAGFKLTT 
GSDFLQWTYQ TLQIPLQGIS DSLGGAIAIG FLVPFFWFFG VHGGLIVGSL AGPMLQANSF 
DNAQLYKAGK LTIANGAHVV TNEFYNNFIN LTGSGITIGL IIFILIAAKS AQLRSIGKVE 
LVPGIFNINE PFLFGLPIVM NPFLAIPFFL TPVVVAISTY FVIKTGIVPP LNGFACPWTM 
PAVISGFLIG GWKMAIWQAC TLVISTLIYW PFAKKYDNIL VKREAATLKK DEAESK