Gene Plav_2954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plav_2954
Symbol
ID	5456733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Parvibaculum lavamentivorans DS-1
Kingdom	Bacteria
Replicon accession	NC_009719
Strand	+
Start bp	3151901
End bp	3153550
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	63%
IMG OID	640878538
Product	alpha amylase catalytic region
Protein accession	YP_001414218
Protein GI	154253394
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0067439
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGTCGGCGG GACGGCAAGG TCAAGAACAA GAGGAAGCGG ACGTGGCGGG AGAGAAGAGC 
GAATGGTGGA AGGGCGCGGT GGTCTATCAG ATCTATCCGC GCAGTTTTCA CGATACAAAT 
GGCGACGGCA TCGGCGACCT GAAAGGCATC GAGGAAAAGC TCGACCATGT GGCGGGGCTG 
GGGGCGGACG CGATCTGGCT GTCGCCGATC TATCCCTCGC CCAATCGCGA TTTCGGCTAC 
GACGTTTCCG ACTATTGCGC GATTGCGCCC GAGATGGGCT CGATGGCGGA TTTCGACCGG 
CTGGTCGAGG CGGTGCATGG GCGGGGCATG AAGCTCATTC TCGACCAGGT GCTTGCGCAT 
ACATCCGAGC AGCATCAGTG GTTTCAGGAG AGCCAGCTCT CCGCCGACAA CCCGAAATCG 
GACTGGTATG TCTGGGCGGA TGCGAAGGAA GACGGGACGG TGCCGAACAA CTGGCTGTCG 
GCATTCGGCG GTCCGGCCTG GTCGTGGAAT CCGGTCAGGC GGAAGTACTA CCATCACAAG 
TTTCTGAAGA GCCAGCCAAA ACTCAACTTC CACAATGAGC AGGTGGTGGA TGCTTGCATG 
GATGTGCTGC GCTTCTGGCT CGACCGGGGC GTGGACGGGT TCCGGCTCGA TGTGGCGAAT 
GCCTATCTGC ACGATGCGGC GCTGACCGAC AATCCGCCGC TGCCGATGGA CAAGCGCACA 
TTCATGGACT GGGCGCATGC ACCGCGGCTG CAGCAGCATA TCCATGACGC GAACATGCCC 
GAGAACGAAT GGGCGATGAA GCGCGTGCGG AAGGTGATGG ACGAGTATGA GGAGCGGCTG 
GCCTTTGGCG AGTTTTCCGA GCGGCCCGAG ATGTTCGGGC GTTATGCGGG CGGTGTCGAA 
CGGTTGCATA CGGGGTATAC GTTCGATTTT CTGGAGGACT GGAGTTTCGA GCCGCCGGTG 
TTCCGCGCCT ATTACGAGAA GCTGCTGGCG CCGCTCAGCG ATCTTTTTCC CTGCGTGACG 
TTTTCGAACC ACGACATCGT GCGGCCGGTG ACGCGGTGGG GCGGCGGACA AGGCGATGAC 
GGGCTTGCGA AGCTGGCGCT GACGCTGCTC GTGGCGTTGC GCGGCACGGT GCTGATGTTC 
CAGGGCGAGG AGCTGGGACT GCCGGAGGTG GACCTTGAGC GGAAATACAT CAAGGACCCG 
GTGGGCGATC TCTATTTCCC GTGGGTGAAG GGGCGTGACG GCTGCCGGAC GCCGATGCCG 
TGGGAGAGCG GCGGGGCGGA GGCAGGCTTC ACCATCGGTA CGCCCTGGCT GCCGATACCG 
GATTATCACC GAATGCGGGC GGTGGATGTT CAGCAGGCGG ATGAAGGCTC CGTACTGGCG 
CATGCGAAGA AGGTTATCGC GCTGAGGAAG GCGCATCCGG CGCTGAAGAC GGGCGCGATG 
TCGTGTCTCG ACGCTGAGGG GAAGGTGCTC GCCTTCACAC GCGAGGGAGA AGGCGAGCGG 
CTGCTCTGCG TGTTCAATCT CGGCAAGGAG GCGGCGAGCT TCGATTTGCC GGAGAGTGCG 
GGCGCGGCGG TGTTCGAGGT TGGGGGCGTG ACACGGGATG CTGCGGCGCT GGCGCTTCAG 
CCGAGGAGCG GGGCGATCTT CAAGGTTTGA

Protein sequence

MSAGRQGQEQ EEADVAGEKS EWWKGAVVYQ IYPRSFHDTN GDGIGDLKGI EEKLDHVAGL 
GADAIWLSPI YPSPNRDFGY DVSDYCAIAP EMGSMADFDR LVEAVHGRGM KLILDQVLAH 
TSEQHQWFQE SQLSADNPKS DWYVWADAKE DGTVPNNWLS AFGGPAWSWN PVRRKYYHHK 
FLKSQPKLNF HNEQVVDACM DVLRFWLDRG VDGFRLDVAN AYLHDAALTD NPPLPMDKRT 
FMDWAHAPRL QQHIHDANMP ENEWAMKRVR KVMDEYEERL AFGEFSERPE MFGRYAGGVE 
RLHTGYTFDF LEDWSFEPPV FRAYYEKLLA PLSDLFPCVT FSNHDIVRPV TRWGGGQGDD 
GLAKLALTLL VALRGTVLMF QGEELGLPEV DLERKYIKDP VGDLYFPWVK GRDGCRTPMP 
WESGGAEAGF TIGTPWLPIP DYHRMRAVDV QQADEGSVLA HAKKVIALRK AHPALKTGAM 
SCLDAEGKVL AFTREGEGER LLCVFNLGKE AASFDLPESA GAAVFEVGGV TRDAAALALQ 
PRSGAIFKV