Gene Sde_0995 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_0995
Symbol
ID	3965120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	+
Start bp	1276856
End bp	1278271
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	51%
IMG OID	637920062
Product	DNA polymerase III, alpha subunit
Protein accession	YP_526469
Protein GI	90020642
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00000812271
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTATTC GCAGCAGCCT ATTGTCCTCC GGTCTGTTAA AATGCACGCC TTTTTTGGGG 
GATGATCGTT TGGCAAGTGA AGTTCGGGCT GTAAGCTCGC TAGCATTGTT GTATGCGTTT 
AGGATGTTGG GCCTATTTAT GGTGCTGCCT ATTCTCGTGC TTTATGCCGG CGACTACCCA 
GGTGCAACGC CTTTTACTTT GGGGTTGGCA CTTGGTATTT ATGGTTTAAC TCAAGCTGTC 
TTTCAAATTC CCCTTGGTTT GCTCTCAGAC TTTATTGGCC GCAAACCCGT TATTATTGCA 
GGCTTGTTGG TGTTTTGTGC CGGCAGTGTG CTTGCAGGTA CGGCCGAATC GGTAGAGTGG 
TTAATTATTG GTAGAGCCCT ACAAGGCAGT GGCGCCATTG CAAGTACCAT TATGGCCATG 
GTGGCCGACC TTACCTCTGA GCAAAACCGC ACCAAAGCCA TGGCCGCTAT TGGCGCTTCT 
ATTGGGTTGT CGTTTTCGCT GGCGATGATT TTAGGGCCTA CGGTGGGCGC GTTTGGTGGC 
TTATCGGTGG TGTTTTATTT TTCTGCGGTA CTGGCGCTTA TTGGTGTGTG CATTGTGATC 
TTTTTAGTGC CTCGCCCGCC GCAAGTAGGG CACTCTCACC GCGACAGTGG CGCGGTGCCA 
GAGCTTATTA TGCAAACCCT TAAAAACACC GAGCTGCTGC GTTTAAATTT CGGTATTTTT 
ACTTTGCACG CGTTGCTAAT GGCCTGTTTC TTGGCAATTC CTGTTGTAGT GGAAAGTAGT 
TTAGGTATTC CTCGGGGTAA GCATTGGCAG GTTTACTTGC CAATGTTGGC TATCGCGTTG 
GGCGTAGTGC TGCCGCTCAT TATGGTTGCT GAGCGCAATC GCAAGTTAAA GCCCGTTTTC 
TTGTTTGCCA TTGCTGTGCT TGTTGTTTCG CAAGCTAGCT TAGCGGTTGT TCCGTTGGCG 
GGCTGGCCGT TTTTATTGCT AATGCTGCTG TTTTTCGTGG CGTTTAACCT GCTGGAGGCT 
TGTTTGCCTT CGTTGGTCAG TAAGCTTGCA CCTGTAGGTG CCAAAGGCAC GGCGATGGGG 
GTGTATTCCA CTAGCCAGTT TTTAGGGGCG TTTATTGGCG GGTCTGTTGG AGGTTACATT 
TTTACCCTGT GGGGTATGGA TGGCCTGTTC GCTGCTGGCG CGCTTTGCGC TGCCGCTTGG 
TTCGCAGTAG CTGCATCTAT GCGCACTCCG CGCCACTTAA GCAGCATGTG TATGGGCGTT 
CAGCGTGAAA GCGGCGCACA GTGTGCGATT GATGTACTCA CATTGCCGGG CGTAGTAGAG 
GCTCTGTGGG TCGAGCAGGA AGGTTTGTTG TATTTAAAAG TAGATAATCG AGAGCTGGAT 
AGGTCCCAGT TGGATGATTT GATTGCGGCG CAATAA

Protein sequence

MGIRSSLLSS GLLKCTPFLG DDRLASEVRA VSSLALLYAF RMLGLFMVLP ILVLYAGDYP 
GATPFTLGLA LGIYGLTQAV FQIPLGLLSD FIGRKPVIIA GLLVFCAGSV LAGTAESVEW 
LIIGRALQGS GAIASTIMAM VADLTSEQNR TKAMAAIGAS IGLSFSLAMI LGPTVGAFGG 
LSVVFYFSAV LALIGVCIVI FLVPRPPQVG HSHRDSGAVP ELIMQTLKNT ELLRLNFGIF 
TLHALLMACF LAIPVVVESS LGIPRGKHWQ VYLPMLAIAL GVVLPLIMVA ERNRKLKPVF 
LFAIAVLVVS QASLAVVPLA GWPFLLLMLL FFVAFNLLEA CLPSLVSKLA PVGAKGTAMG 
VYSTSQFLGA FIGGSVGGYI FTLWGMDGLF AAGALCAAAW FAVAASMRTP RHLSSMCMGV 
QRESGAQCAI DVLTLPGVVE ALWVEQEGLL YLKVDNRELD RSQLDDLIAA Q