Gene Rcas_0998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0998
Symbol
ID	5538464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1303441
End bp	1304616
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	61%
IMG OID	640893141
Product	galactokinase
Protein accession	YP_001431124
Protein GI	156740995
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0153] Galactokinase
TIGRFAM ID	[TIGR00131] galactokinase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGATA CCGGAACGTT GCGCGCGCGC TTTCAGCAAC ACTACGGCAT ACATCCCTCT 
GTGATCGTTC GCGCGCCGGG GCGCGTCAAT CTCATCGGTG AGCATACCGA CTATAACGAT 
GGTTTCGTTT TTCCGGTCGC CATTGATCGC GCCACCTACG TCGCGGCGCG TTTGCGCCAT 
GATCAACTGG TGCGGGTGGC GTCGTCCGAC CTCAACGAAG AGGATACGTT CGCCATCGAT 
CAGATCGAAC GCAGCAACCG ACCATGGCAC AATTACATTC GTGGCGTGGC GCTGGCGCTA 
CGAGTTGCAG GGCATCCGCT TTTGGGGGCC GATCTCCTGA TCGCCAGTGA TGTCCCGCGC 
GGTGCGGGGC TTTCGTCATC AGCCGCGCTC GAAGTCGCCG TCGGGTATGC GTTCCAGGTG 
CTCAATAATC TGAACATTCT CGGCGAAGAA CTGGCATTGC TGGCACAGGG CGCAGAGAAC 
AACTTCGTCG GCGTGCAATG CGGCATTATG GACCAGTTGA TTGCGGTGCT CGGTCGCGCC 
GATCATGCGC TGCTGATCGA CTGTCGTGAT CTGTCCTATC GCGCCGTTCC GCTGCCCCCA 
TCGGTTGCGG TCGTCATCTG CGACAGCCAT ATTCCGCGAA CTCTGGCGGC ATCGGCATAC 
AACCAGCGGC GCCAGGAGTG CGATATGGCG GTTCAGTTGC TGCGCCGGTG GTATCCGGGT 
ATTCGCGCAT TGCGCGATGT CAGCGAGGAT CACCTGGCAG CCCATTCCGA TGCGCTGCCA 
GAGCCGATTC GCTCGCGCGC CCGGCATGTG GTCCGTGAAA ACCGTCGCAC ACTCCAGGGC 
GCAGAAGCGC TCGAACGCGG CGATGTGGTC ACATTCGGGC GGTTGATGAA CGAGTCGCAC 
GCCAGCCTGC GCGACGACTA TCAGGTGAGC CTGCCCGACA TCGACATTCT GGTCGAAACG 
GCGCACCATC TGGCGGGATG TTACGGATCA CGCCTGACCG GCGCAGGATT TGGCGGGTGT 
ACGGTGAGCC TGGTCGAGCG CAATGAAGTG GAATCGTTCA GCCGCGACCT GTTGCGCGTA 
TATCACAATG CCACCGGTCG CACGGCCACC ATCTATGTAT GTCGCGCCAG CGATGGCGTT 
GGGCGCGCCA CGGACAATGC AGGTCCACAG GAATGA

Protein sequence

MLDTGTLRAR FQQHYGIHPS VIVRAPGRVN LIGEHTDYND GFVFPVAIDR ATYVAARLRH 
DQLVRVASSD LNEEDTFAID QIERSNRPWH NYIRGVALAL RVAGHPLLGA DLLIASDVPR 
GAGLSSSAAL EVAVGYAFQV LNNLNILGEE LALLAQGAEN NFVGVQCGIM DQLIAVLGRA 
DHALLIDCRD LSYRAVPLPP SVAVVICDSH IPRTLAASAY NQRRQECDMA VQLLRRWYPG 
IRALRDVSED HLAAHSDALP EPIRSRARHV VRENRRTLQG AEALERGDVV TFGRLMNESH 
ASLRDDYQVS LPDIDILVET AHHLAGCYGS RLTGAGFGGC TVSLVERNEV ESFSRDLLRV 
YHNATGRTAT IYVCRASDGV GRATDNAGPQ E