Gene Rcas_4140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4140
Symbol
ID	5541651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5360198
End bp	5361937
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	59%
IMG OID	640896251
Product	hypothetical protein
Protein accession	YP_001434189
Protein GI	156744060
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.232862
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00288889
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCGGCA TAGCAGGAAT GCGCGCGTGG GCGCAGACGG CGGCACGAAT GCAGTCCGGC 
GACTGGGTTG TTCTGGCGCT CCTTGTCTGT GGAGCGCTGG CGATGATGTA TCCGGTGCTT 
GCCGCGCCAT CATCTCGTAT CATAGGGTGG CCTGGCGACA ATATTCAGTA TGTCTATGCT 
GCAGGATGGA TGGCTGAGGC GTTGCGTTCC GGTGCGTCGC CGTTTGTCGA TCCGCGCATC 
AATGCGCCTC ATGGTCTGGC GTTGACTGCC ACCGATGTGC CTTATGTCGG ATACATTGCA 
GTTGCGCCGC TGACCTGGCT GTTCGGTCCG GTGTTTGGGT ACAACGCGCA ACTTGCACTG 
GCGCATCTCC TCTCAGGAGT GTGCGCGTAT CTTTGGGTCC GTCATCTTAC CGGCAGTCGG 
ATTGGAGGAC TGACGGCAGG ACTGGCGTTT ATGCTGGCGC CGTTTCGTCT CGCGCATAGC 
TACGGTCATC CGCAGATTGT CAGCACCTAT CCGTTGCCAC TGTTTTTCTG GGCGCTGGAT 
TCGTCGCTGC GATCACAACC GGATCGCAAG ACGCTTGCGG GTCTGGTCGG TGCGACATTT 
CTGCTCGGTG CGGCATCGCA GTACTATCTG GTGATCGGTC TGATCTGCGG GATGGTTTAT 
GCGCTGCTGA CGCTGGCGAC ACGCCGGGTG AGTCTGTTAT CCAGGGTCTG GCTTGCGGTT 
CCTGCTGTCT TTGTCGGAGC ATTGCTGGCG GCTGCCCCTT ATCTGATGAC GGCGCGCGAT 
GGCATTTATA CACCTTACCA TCTCGACGTT GCTCGTATGT GGTCGGCAAG CCCGATGAAC 
TTTGTGGCGC CCTCCCATCT TCACCCACTC TGGGGGACCT ATGTCGAGCG GTTGCGCCCT 
GAGACGCTGT GGGGCGAAAA AACACTGTAT GTCGGCATTG TTCCCGGAAT ACTGGCTCTG 
GCGGCGCTTC GCGCTTTTGA TCGCCGGTGG GTCTGGATTG GCACCGCGCT CGTTGCTGCC 
GTTCTGTCGC TCGGCACCGA TCTCCACATC GGGAATGTTC CCCTGCATCG CGATCATCCG 
GTCTGGCTGC CGGCATATTA TCTGCACCAG TTGCCGGGTA TAAATCTTAT GCGCGTATGG 
GCGCGTTTCG GGATCGTGAC GATCCTGTTT GTTGCGTTGC TGGCGGGCAT CGGCGCTGCG 
CGACTGGTTC ATCGAAAGAG TGTAGCGGGG CGTCTCACGA ATGGTTTCGG CGGCGCTGCG 
CGCCTGAGAA TATCGTCTGC TGCATTGCTT TCCGGTGCGA TTGTCGCGTT GATAGTAGTG 
GACTTGATGC CGGGGAGAAT GAACGAGTAC ACAACGCTGG CGCCACGCCC GATTGATCAC 
TGGCTTGCCC GGCAGCCCGG CGATTTTACA GTTGGATTCG TCCCGGTTAT TGATGCGACG 
ACCAACTACT TCATTTTGTT CGGCACGCTC ACGCATGGCA AGCGAACGAT CGCCTTTATG 
CACCAGGCGC ATCTTCCGCC AATCTTCCAG GATTTCAACG AACGTTCGCG GGGATTCCCC 
GACAGCGCCT CGGCGCAGCG ACTGCGCGAA CTTGGGATAC GCTATTTGCT GCTCGAAAAA 
CCCATGTTCG ACGGCGCGCG CGCTTTCCGC TGGAGCGTCG TTGAGCAGCG GTTGGCAGAA 
ACGCCGGAAT TGCGCATTGT GCGGGAAGTC GGCGATGTTG TGGTCGTGGA ATTTCGCTAG

Protein sequence

MAGIAGMRAW AQTAARMQSG DWVVLALLVC GALAMMYPVL AAPSSRIIGW PGDNIQYVYA 
AGWMAEALRS GASPFVDPRI NAPHGLALTA TDVPYVGYIA VAPLTWLFGP VFGYNAQLAL 
AHLLSGVCAY LWVRHLTGSR IGGLTAGLAF MLAPFRLAHS YGHPQIVSTY PLPLFFWALD 
SSLRSQPDRK TLAGLVGATF LLGAASQYYL VIGLICGMVY ALLTLATRRV SLLSRVWLAV 
PAVFVGALLA AAPYLMTARD GIYTPYHLDV ARMWSASPMN FVAPSHLHPL WGTYVERLRP 
ETLWGEKTLY VGIVPGILAL AALRAFDRRW VWIGTALVAA VLSLGTDLHI GNVPLHRDHP 
VWLPAYYLHQ LPGINLMRVW ARFGIVTILF VALLAGIGAA RLVHRKSVAG RLTNGFGGAA 
RLRISSAALL SGAIVALIVV DLMPGRMNEY TTLAPRPIDH WLARQPGDFT VGFVPVIDAT 
TNYFILFGTL THGKRTIAFM HQAHLPPIFQ DFNERSRGFP DSASAQRLRE LGIRYLLLEK 
PMFDGARAFR WSVVEQRLAE TPELRIVREV GDVVVVEFR