Gene Rcas_4066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4066
Symbol
ID	5541577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5277082
End bp	5279229
Gene Length	2148 bp
Protein Length	715 aa
Translation table	11
GC content	61%
IMG OID	640896178
Product	hypothetical protein
Protein accession	YP_001434116
Protein GI	156743987
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.174208
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTCCA TTACGCAACA CACACCAAGA GTTGCTGTAT TCCCACACCT AATTGCCCTG 
GCGCTCTATA CCCTGCTTGG CATTCTCCTG ACGTGGCCCT TACTGCTAAA CCTGACAAAT 
GGCGTCATCG GCGCTGTTGA CGGCGTCGAT GCTTATCAAA ACGCCTGGAG TCTATGGTGG 
ACGGCGCAGG CGCTGACCTC GCTGCGCAAC CCTTTCTTTT CGCCGCTCCT CTTCTACCCC 
GATGGCGTCG ACCTCTTTTG GCAGCCGCTT GGGTTCAGCC AGGGAGTGCT GGCGCTGCCG 
GTGACGCTTA CGCTGGGACC GGTCGCTGCG GTCAACTGGA TTGTGCTCAC CAGTTTTACC 
GTTGGCGGAT ATGCAACCTT TCTGCTAGCG CGGCGCGTGA CCGGCAATGC AGCGGCAGCG 
CTGGTGGCGG GCGCCACCTT TATCTGTTCG CCCTATCACA TGGAAAAGGT GATTGATGGC 
AACCTGGAAG TGGCTGCCAT TCACTGGCTT CCGTGCTATG CCTATGCCCT CTTGGCGCTG 
CTCGACCGTC CATCATGGCG TCGGGCGCTG GCGGCTGGCG CTCTGCTCGT CTGGGTCAGC 
CTGGGCAGCT GGTATTACGG GCTATTCGCC GTGCTCTTCA CGGCGTGCGC TGCCGGTATC 
TGGGCATACG GCGCCACCCG CAATGCAGAG CGCATGCATC AGTTGCAGCG CGGCTTACAG 
CAGGCGATGT GGGGAGTAGC CCCCTTAGTC ATTTTGGTGA TGGCGATTGC ACCGGCGTTG 
TATAGTCTGG TGACAACCGG AGCGGACGAG ATGCTGTGGG ATATGCGCTC GATACAGCGT 
GAGCGCTCTG CCGATTTAAT AGATGCATTT CTGCCCAATC CGGTCCATCC TGTGTGGGGT 
CCGGCGGTGC GCGCCTGGCG TAACCAGATC TATCCCAACG CGGTGATCTG GAATGTGTCG 
CTGGGGTGGA TCGCGCTCGG ACTCGGACTG TTGGGCGCTA CTACTGCGTG GCGTGCCACG 
TGGCGCTGGT CGCTGCTGGC GCTGGCATGC TTCATTGTCG CCCTTGGACC GGAGTTGAAG 
ATCGCAGGCT GGCACACCGG TCTTCCACTG CCGTATACTC TCATCCAGGA TATGCCCGTC 
ATTCGCTCAG GGCAGCGACC GAACCATATG ATGGTAATGG TCAGTCTGAG CCTCTCGATC 
CTTGCGGCAT ACGGCTTTAC CGTGTTGCAA CAACATCTCA TACAACACCC CTCGCCAATC 
CATATGTGGA GTATGGCGCT TGCATTGATC GTACCGGTTG CTGGTATTGA CGGATACGCC 
GGGACCCACA CCATCGTCGC GCGCCGCATC CATCCATTCT ACGCCACATT GCCGCCTCCC 
GACGGAGCAA TCATAGCGTT GCCGCTCTAT CTTAACGTCA ACCGTAGCGA GAACCTGACG 
GCACAGATAG GTCATGGATG GCCCATCATC GGCGGGTATG TCGCCCGTCC GCCTGCATAC 
GTATTTCCGA AGTATACCCC TGGTGTCCGT GAGATACAGT TTGGTGAAGT CGAAAGACAG 
GACGTCGTAT CGCCTGGATG GCCCGAATCT GCCCGGCGAG CGCTGGCGGC GTACCGCATT 
CGCTACATCA CCATGGACTT GCAAAGCAAT AAAGACGAGT ATTTTGCGCG CCTCCGCCCG 
CTCCTCGCTG AGTTGGGGAT CGAGACGCCA GTCTTCGTTG ATGAGACGCT GGAAGTTTAC 
GCTGTACCGC AAGCCTGGCG GGTCGTGCCG GTGGCGTTTC TGGGCGACGG GTGGCAACCG 
CTTGAACGCG AACCGGCAAC CGGCGTTCGC TGGCGCTGGA TGGGCGAGCG CGCCGAAGTG 
CGGCTGTTCA ATCCCCTCGT CGGCGCGGCG TTGGTGCGCC TGACTTTCTG GATGGAGGCG 
TACTATGAGA CGCGACCACT CTGGTACACG CTCAACAATA TGGCGCTGGG AACAGTCACC 
GTTCCTTCCG GGCGCGCGCC AGCGCGCGCA ATCTACGTGC TGCTTCCGCC CGGCGACCAT 
GTGCTGACCT TGCAGGCGCC CGCTGATCCT GACCCGGCGC GCGCTGGCGC GCCGATCAGC 
ATCCGTCTGT TTGCGCTCGA TGTCCGCAGC GCTGCCGGCG CGCCATAG

Protein sequence

MASITQHTPR VAVFPHLIAL ALYTLLGILL TWPLLLNLTN GVIGAVDGVD AYQNAWSLWW 
TAQALTSLRN PFFSPLLFYP DGVDLFWQPL GFSQGVLALP VTLTLGPVAA VNWIVLTSFT 
VGGYATFLLA RRVTGNAAAA LVAGATFICS PYHMEKVIDG NLEVAAIHWL PCYAYALLAL 
LDRPSWRRAL AAGALLVWVS LGSWYYGLFA VLFTACAAGI WAYGATRNAE RMHQLQRGLQ 
QAMWGVAPLV ILVMAIAPAL YSLVTTGADE MLWDMRSIQR ERSADLIDAF LPNPVHPVWG 
PAVRAWRNQI YPNAVIWNVS LGWIALGLGL LGATTAWRAT WRWSLLALAC FIVALGPELK 
IAGWHTGLPL PYTLIQDMPV IRSGQRPNHM MVMVSLSLSI LAAYGFTVLQ QHLIQHPSPI 
HMWSMALALI VPVAGIDGYA GTHTIVARRI HPFYATLPPP DGAIIALPLY LNVNRSENLT 
AQIGHGWPII GGYVARPPAY VFPKYTPGVR EIQFGEVERQ DVVSPGWPES ARRALAAYRI 
RYITMDLQSN KDEYFARLRP LLAELGIETP VFVDETLEVY AVPQAWRVVP VAFLGDGWQP 
LEREPATGVR WRWMGERAEV RLFNPLVGAA LVRLTFWMEA YYETRPLWYT LNNMALGTVT 
VPSGRAPARA IYVLLPPGDH VLTLQAPADP DPARAGAPIS IRLFALDVRS AAGAP