Gene Rcas_2217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2217
Symbol
ID	5539698
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2863973
End bp	2866003
Gene Length	2031 bp
Protein Length	676 aa
Translation table	11
GC content	62%
IMG OID	640894350
Product	hypothetical protein
Protein accession	YP_001432318
Protein GI	156742189
COG category
COG ID
TIGRFAM ID	[TIGR01319] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00000677217
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCGTCC CAATCGCATT GCATGCCTTT CTGGTCGCCG ATGTCGGCAG CACAATGACG 
CATGTCTGGC TGGTTGACGC CGTCGATGGC GAAACTCGTC TTATCGGCTA TGCCGAAGCG 
CCGGGCAGCG TTCCTTCGAC CGGCGACGCA ACACCCGCCA TTCTCGAAGC CGTACAGCGC 
ATCGCAGAAC AAACCGGTCG CCGTCTGATC GACAACAATA CGCTGGTGAT GCCGAAAGAG 
GCGGAGGGCG ATGGTGTTGA CGGCATTCTG GTCTGTAGCA GTGCAGCAGG CGTTATGAGC 
CTGATCATTG CGGCGGTCGC CGGCGATATT TCGGCGCGGA GCGCGCAACG CGCCGCGCGT 
GCAACATATA CTCGCGTCCT TCAAACCATC ACGCTCGATG ATGCAGTTCA CCAGGAACAG 
ATCGGCGTCC TCGCAGATTC GGGCATGACC TGGATCGAAC GCCAGGTGCA GGCGTTGCTC 
GGAGTGCAGG CTGACGGCGT AGTGATTGTC GGCGGAATCG AAGGCGGCGC GCACGACGCG 
CTCATTCGCC TCGCACATAT CGTCGGACTG GCATCACGGA GCGTTCAGAC AGACGCCCAG 
GGCAGACAAA CCTACAATGC CGCCCGAAAA CCGATCATTT TCGCAGGAAA CAGTCAGGCG 
CGTGCAGGGG TGGCTGCGGC GCTGGAGGAC CACCCCGATC TCATCGTGGT TGACAATATT 
CGACCAACCC TGGACATCGA GCGCCTCGAT CCGGTGCGCC GCGAAATCGT GCGCTTCTAC 
AACGAGCACA TCCTGACCCG CTTCGCGCGA ACATCGGGCC TTCAGCGCCT CTCTCGCGCG 
CCTGTGTGCA CATCGTGCGA CGCCACGGGT GTGATAACCC GCTTCGCGGC GGAGACGGCG 
CAGTGTAACG TTCTGACCCT CGATGTCGGC TCATTGAGCA CGACTGCGCA CTTGTGCAGC 
GAAGGACGCT ATAGTCCCGT CGTTTTGGGC GGCGTCGGCA TCGGGTATGG GGTTGGGGCG 
CTCCTGGCGC AACGCGGAGT CGGCGCCATC CGACGCTGGC TGCCCTTCCC GATCAGTGAG 
CGCGACCTGG CACACTGGCT CCTCAACAAG ATGTTGCGTC CGCACATTCC ACCTCTGACC 
CGCGAAGAAC TGCTGATCGA GCACGCAGTA GCGCGCGAGG CGCTTTCCCG CGTGATAGAG 
ACGCTCCTGG ACGAGCGACC CGATGCACGA TACGACCGCG TCTTCGTTGG TGGCGGAGTG 
TTGCGCCATG CACCCCATCC CGGCCTTGCA TTGCTCACCG TTCTGGATGC ACTGCAACCA 
ACCTCTCAAG AGAATATCAT GACACTCGAT GTGCACCTTG ATAGCCTGGG GTTAATGAAT 
GCCTGCGGCA CACTCGCCTT TTCCGAAGCC GACGCCGCGC TGACGTTGTT CGAGCGTGAC 
CTGATGAACA ACACGCCGCT GGCGACGGTC GTCACAACGC TTGGCGAAGG GCGTGCAGGA 
GAAACGGCAG TTGAAGCCGA GTTGCGGGTG GAAGGCAAGT CCACCTATAC GATGCGTGTC 
GCTCATGGTG AGATCGCATG TTTGAGCCTG CCCCCTGGCC AGTACGGCAC GCTGACGCTG 
CGACCAACCG CTGGTGTGCG GATCGGGCGC AACGCACCGG GCGCCGAAGT CGCCTCAGAA 
CTGGCGGCCA TTCGCGGCAG CGCCCTTGGT GTGGTCATCG ACGCGCGCGG CAGACCGCTA 
CGCCTGCCGG ACGAGCCAGC GGCGCGGCAG CAGGCGCTCT GGTCGTGGTT AGTGGCGCTT 
GGCGTCGAGC GCGAACCATT GCCATATCCG GCGCTCGACA CGGTTATCGA AGCGCCGTCG 
CCGACTCTGT CTTCCACAGG GAGTGAGCCG CACAGCAGCC GAGCGTCACT CTTGCAATCC 
GACGAACGCC CGTCAACGGA GTCAGGCGAC AGCATCGAAC GTGATCTGGC AAAACTGCGT 
GAGACAGTCG AGACCCCCCA GAAAAGGCGT GGGCTTTTCC GCCGAAATTG A

Protein sequence

MSVPIALHAF LVADVGSTMT HVWLVDAVDG ETRLIGYAEA PGSVPSTGDA TPAILEAVQR 
IAEQTGRRLI DNNTLVMPKE AEGDGVDGIL VCSSAAGVMS LIIAAVAGDI SARSAQRAAR 
ATYTRVLQTI TLDDAVHQEQ IGVLADSGMT WIERQVQALL GVQADGVVIV GGIEGGAHDA 
LIRLAHIVGL ASRSVQTDAQ GRQTYNAARK PIIFAGNSQA RAGVAAALED HPDLIVVDNI 
RPTLDIERLD PVRREIVRFY NEHILTRFAR TSGLQRLSRA PVCTSCDATG VITRFAAETA 
QCNVLTLDVG SLSTTAHLCS EGRYSPVVLG GVGIGYGVGA LLAQRGVGAI RRWLPFPISE 
RDLAHWLLNK MLRPHIPPLT REELLIEHAV AREALSRVIE TLLDERPDAR YDRVFVGGGV 
LRHAPHPGLA LLTVLDALQP TSQENIMTLD VHLDSLGLMN ACGTLAFSEA DAALTLFERD 
LMNNTPLATV VTTLGEGRAG ETAVEAELRV EGKSTYTMRV AHGEIACLSL PPGQYGTLTL 
RPTAGVRIGR NAPGAEVASE LAAIRGSALG VVIDARGRPL RLPDEPAARQ QALWSWLVAL 
GVEREPLPYP ALDTVIEAPS PTLSSTGSEP HSSRASLLQS DERPSTESGD SIERDLAKLR 
ETVETPQKRR GLFRRN