Gene Rcas_1307 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1307
Symbol
ID	5538779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1685665
End bp	1686831
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	62%
IMG OID	640893445
Product	hypothetical protein
Protein accession	YP_001431422
Protein GI	156741293
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.323452
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.304058
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTTC TACTCAAGGG AGTGTCGCGT GAAGAGGTGC GAGAACTAAT TGCGCTGAAC 
GAAACACCGT GGGTTTCGTT ATTCCTGGCG CCCCATCCGC CCGGTGAAAC CATCCAGCGC 
GCGATTCAGC TCGAAAATCT GCTGCGCCGC AGTGAGGCGG AACTTGAGGC GAGCGGGTAT 
GATCGCGACG ATGCCCACGC GATGCTGGCG CCCGTGTGGG AGATGACCGA CGCGCGGACT 
CTGGAGGAGT ATCAGGACGC TGGACTGGCG TGCTATGTTG CACCCGGTCA GTTCCACCTC 
TATCGCCTGC CGCACCGCGT CAGCGACGCT GTGATCGTCG GGCGGCGCCC TTTCATTAAG 
CCGCTGCTTA TGCCCCGTCC GGCAACCGAC TCGTTCTATG TGCTGGCGCT AAGCAAGAGT 
CGTGTGCGTT TGCTCCACGC TACACCGTCG GGCATCACCG CCGTGCCGCT TCCCGACGCG 
CCTGCCGGTA TCGACGATTT GCCGCAGACC GACCCGACCG GACGCCAGGC GCAGCGCCAT 
GTTGCTCCTT CGACGCGCGG CGGCGCCAGC GGTGCGATGT ACCCCGGTCA CGGCGGCAAC 
ATCTACGACG AAAAAGCCGA GGTGCAGCGT TATCTTCAGG CAGTGAGCAA TGCGGTCGAA 
CGTGCGTTGA GTCGCGCGCG CGATCCGCTC GTGCTGGCAG GCGTCGATTA CATGGTGTCG 
ATGTACCGTG CATTGAATGG CTATGCGCAC GTCATCGACA CCCATATCAG CGGTAGTCCT 
GACCACGTGA ACGATGAAGC CCTGGGTGAA CGCGGAGCGC ACGTGCTGAT GACGCATCGA 
AGCCGTCTGG CAACTGATGA GCGCGATCGC TTCGAGGCGC TGTTGCAATA CAACCCGCCG 
CGCGCCAGCA CGAATCTGCG CTCAATCCTG CCGGCTGCAC ACGCCGGTCG TGTGGCACGA 
CTCCTCGTTG CCAGCGATCG GCAGATGTGG GGACGCTACA ATCCCGATGA CGAAACGATC 
TCGCTCCATG ATGAGCCGCT GCCGGGCGAT GATGACCTGC TGGACATTGC GGCGCAGCAA 
ACGCTGCTCC ACGGCGGCGA AGCCGTTGCG GTTCCGGCAA CGGATATTCC CGGCAGTAAC 
GGCGTGGCAG CAGTTTTTCG CTACTGA

Protein sequence

MKVLLKGVSR EEVRELIALN ETPWVSLFLA PHPPGETIQR AIQLENLLRR SEAELEASGY 
DRDDAHAMLA PVWEMTDART LEEYQDAGLA CYVAPGQFHL YRLPHRVSDA VIVGRRPFIK 
PLLMPRPATD SFYVLALSKS RVRLLHATPS GITAVPLPDA PAGIDDLPQT DPTGRQAQRH 
VAPSTRGGAS GAMYPGHGGN IYDEKAEVQR YLQAVSNAVE RALSRARDPL VLAGVDYMVS 
MYRALNGYAH VIDTHISGSP DHVNDEALGE RGAHVLMTHR SRLATDERDR FEALLQYNPP 
RASTNLRSIL PAAHAGRVAR LLVASDRQMW GRYNPDDETI SLHDEPLPGD DDLLDIAAQQ 
TLLHGGEAVA VPATDIPGSN GVAAVFRY