Gene Apar_1256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1256
Symbol
ID	8414135
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1406158
End bp	1407444
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	40%
IMG OID	645022848
Product	PTS system, lactose/cellobiose family IIC subunit
Protein accession	YP_003180272
Protein GI	257785055
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00359] phosphotransferase system, cellobiose specific, IIC component [TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGAAGT TACAAAAGTT TCTTGAAGAA AAGCTGGGAC CGGCAATGTC CGTTCTCGGG 
TCTAATCGGT ATTTACTGGC GGTAAGAGAT GGTGTTATCG GAGCGCTTCC TCTTATTATC 
GTAGGTTCCT TCTTTTTGAT TATTGCGTTT CCTCCTATCC CTCAAGATTG GGAAATTTAT 
AAGTTCCTTT CTCAAAATGC CGCAAAGATT CTTCTTCCAT ATCGAATGAC CATGTACATC 
ATGGCGCTTT ATGCCGTTTT TGGAATGGGA AACAGTCTTG CTAAATCATT CAAGTTAGAC 
GGGCTTTCTG GCGCGATTCT ATCCGTTATG GCTTTTCTTC TTACCATCAA CCCAGTTAAC 
GTGTTAAAAG ATGCAAACGC TGGTGTAACT GGCTTTGTTA TTCCTATGGC AAATCTTGGA 
TCTGCAGGTC TTTTTGTAGG TATTATTTCA ACTTTTATTG CAGTTAATAT TTATCGTTTT 
ACACAGCACT CTAACTTTAA GATTACAATG CCTGAACAAG TGCCTGAATC AGTTTCTCGA 
TCTTTTGAGG CACTTACTCC AACGCTGCTT GTTATTCTTC TTTTTGGCTC CATTACTTAT 
TACTTTGGAT TTAACTGGAA TGCAGCCATT ACCACTCTCA TCAAGCCTCT TGTGTATGCA 
ACTGATAGTC TTCCTGCTGT TATGCTTATT TCGTTGCTCT ATGGATTCTT CTGGTTCTTT 
GGTATTCATG GTGCCTCGAT TGTTGGTTCA ATCGCACGTC CTTTATGGCT TACTTTGCTT 
GAGGCAAATA CCACTGCAGT TGCCGCTGGC GTTGCAGGAA CTCAACTTCC TTCGATTAGT 
GCGGAGCCGT TCTATCAATG GTTCATTTTC ATTGGTGGTG CTGGTACAAC AATTGGACTT 
GCAATTTTGC TGGTAACTGT TTGTAAGTCT AAGTATGCAA AAGATCTTGG TCGCATTGCA 
TTTTTCCCGG CGCTCTTTAA CATCAATGAG CCAATTATTT TTGGTGCTCC TATTGTTTTG 
AATGTTACCC TTGCAATTCC TTTTGTGCTT ACACCTGTTG TGTGTGGAGT TATATCTTGG 
TTTGCAACAG TGCTTGGTCT GGTAAATCGC GTATCAGTTA ACGCCCCTTG GACACTTCCA 
GGACCTATTG GTGCATATCT TGCGACTGGT GGAGATTTCC GAGCTATTAT TTTGAGTATT 
GTTTTGATTT TAGTTTCAAT TTTGATTTAT TATCCATTCG TAAAAGTTTG GGATAAACAG 
AATCTCTCTC AAGAGCAGAA TGCATAA

Protein sequence

MEKLQKFLEE KLGPAMSVLG SNRYLLAVRD GVIGALPLII VGSFFLIIAF PPIPQDWEIY 
KFLSQNAAKI LLPYRMTMYI MALYAVFGMG NSLAKSFKLD GLSGAILSVM AFLLTINPVN 
VLKDANAGVT GFVIPMANLG SAGLFVGIIS TFIAVNIYRF TQHSNFKITM PEQVPESVSR 
SFEALTPTLL VILLFGSITY YFGFNWNAAI TTLIKPLVYA TDSLPAVMLI SLLYGFFWFF 
GIHGASIVGS IARPLWLTLL EANTTAVAAG VAGTQLPSIS AEPFYQWFIF IGGAGTTIGL 
AILLVTVCKS KYAKDLGRIA FFPALFNINE PIIFGAPIVL NVTLAIPFVL TPVVCGVISW 
FATVLGLVNR VSVNAPWTLP GPIGAYLATG GDFRAIILSI VLILVSILIY YPFVKVWDKQ 
NLSQEQNA