Gene Rcas_3809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3809
Symbol
ID	5541311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4979268
End bp	4980485
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	62%
IMG OID	640895919
Product	hypothetical protein
Protein accession	YP_001433866
Protein GI	156743737
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCATC TATCGCTTCG CCCACAACCA CTCGGTATCT TTCCCGCACC GACGGGGTAC 
CTGGTGATTC CGCCGGTTGC CGGCGCCGAA GAGGTCTGCG CTGCGCTGCT TGCAGGGCAC 
ACGCCGGAAC ATATGCCCGA TGCGCTTCGC TTTTACACGC TGGCGCTGGT GGATGATCGT 
GAAAGCGCCT GGCGCGCGTT GGCGTATGAT TCCTCACCGG AAGCGCACTA CAATCGTTTT 
GTGCTGCACA GTGACCCGGA TATCTATCCA TATTTGCGTA AGCAGTTACG CGGCGATCTG 
GCTGCCCTGC TCGACTTCGT GGCGTATATG GTCGGCTTAA GAGATGCGCC GCCTGATGCA 
GACGCAGTAT GTGGCGAAAT TGCCGCGTGC ATCCTGCCGG CGCATGCTGC GGATGCGCTT 
GCCCGCCAGC AGTACGATGC CGCTATCGCC GCGCTCCAAC GCGCAGTCGA AGAAGTTCGG 
CACATTTCGC CATTGTTTGC TGCGCAGCTG CTGGATCGTC TGGCGACGAT CCACGCCGGT 
ATCAGCCAAT CGGCGGCGGC GCTTCAGGCA TTGCGCGATG CCGTGAAACT GGCCGGCGGG 
GGGCGTCGCC TCGACCTGCG CGCGTATCTG GCGTTGCGGT TGGGGATGTT GTGCCAGGAT 
CTCGCTCATG GGCAGAGGAA CCTGCTGATT GAGGCGAACA CATGGTTCGA GGAGGCGTTG 
CGTTGCTGCT CGATTGAGAG CGACCCCGAC CTCTACGCGC TGGCGCATTA CCGGCTGGCG 
CTGACGATCC TGGCGCTTGC GCCTGCGGGC AATGGCGATC AGATATTGCG CGAACGAGCC 
ATTCAGTCGT TGCGGGAGTC GCTCCGGGTC TACACCTGCG ATACGCACTA CGAGCAGTGG 
CTCAATGCAC AGGTTACGCT TGCCAATGCC TTGCGGATTT CGTTTGTTGC ATCCCCTGCC 
AATCATCTGA TCGAAGCGGT GCGCCTGTAC GACGAGGCGC TGGCAAGCCG CGATCAGGAG 
TGTGATCCGA TCTGGTACGG ACGTCTGCTG GCGAACCAGG GGAATGCGCT GTTCCATCTT 
GGCGATTTTG CCCGCGCCCG TGACCGTTTG ATCCGCGCCC GCGCGATCTT CCTTGCTCAC 
CGTGACTATG GCGCTGCGGC GTTGCTCGAC GAGGCGCTGG TCGAAATTGA GTGCCGGGGG 
TTAGGGGTAC GGGGCTAG

Protein sequence

MAHLSLRPQP LGIFPAPTGY LVIPPVAGAE EVCAALLAGH TPEHMPDALR FYTLALVDDR 
ESAWRALAYD SSPEAHYNRF VLHSDPDIYP YLRKQLRGDL AALLDFVAYM VGLRDAPPDA 
DAVCGEIAAC ILPAHAADAL ARQQYDAAIA ALQRAVEEVR HISPLFAAQL LDRLATIHAG 
ISQSAAALQA LRDAVKLAGG GRRLDLRAYL ALRLGMLCQD LAHGQRNLLI EANTWFEEAL 
RCCSIESDPD LYALAHYRLA LTILALAPAG NGDQILRERA IQSLRESLRV YTCDTHYEQW 
LNAQVTLANA LRISFVASPA NHLIEAVRLY DEALASRDQE CDPIWYGRLL ANQGNALFHL 
GDFARARDRL IRARAIFLAH RDYGAAALLD EALVEIECRG LGVRG