Gene Rcas_1668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1668
Symbol
ID	5539144
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2147527
End bp	2148978
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	62%
IMG OID	640893805
Product	hypothetical protein
Protein accession	YP_001431778
Protein GI	156741649
COG category	[S] Function unknown
COG ID	[COG1300] Uncharacterized membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00126886
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0026953
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCGCTG TAAGCGCGAT ACGCATCATT GTTCGCCGTG AAGTCAACGA CACACTGACC 
GATTGGCGTA TTCTTGTGCC AATCTTTATT CTCACATTTG TGCTGCCACA ACTGTTGATC 
GCTGCATCGA GCGTGGCAAT CGACTTTGTC GGCGATCGCG GGTCGGTCGT TCGTCTCATT 
CCTTTCGCCA TGTTGCTGGT CGGCTTCATT CCCGCATCAT TTTCGCTGAT CACCGCGCTC 
GAGTCGTTCG TCGGCGAACG GGAGCGCAAC AGCCTGGAAG CGCTGCTGTC GATGCCCCTC 
TCTGACCATG CGCTCTACCT GGGGAAACTC CTTTCTGCGC TCATTCCGCC GCTCATGTCG 
TCGCTCCTGG CGATGACCAT CTTTGGCATC TCGCTGCGCG TGCGTGAACC CGACCTCTTC 
TTCGATGGAC TGACGTTCGA GTATCTGGTG GTGGTGCTGC TCCTGATCCT GGTGAAGGCG 
GTGGTCATGG TCGCCGGAGC CGTGATCATT TCGAGCCATA CGACGAGTAT TCGCGCCGCC 
AATCTGCTGG CAAGCTTCGT GTTGTTGCCG ACGGCGGCAA CCATTCAGCT CGAAGCGCTC 
CTGATCATTG CGCGCCGCTG GGACGTGCTC TGGCTGGCGG TCGCGCTCCT GCTCGTGATC 
GCCGCAGTGC TGACACGCAC CGGTATGGGG GCGTTCAACC GTGAAGAGAT TCTATCGCGC 
GAGCACGAGC AGCTGAACCT GCGCCATATC GCGCAAACAT TCCTGACGTT TGCGCGTGAG 
TATCAGCCGG CAGGCACGCC GCCGGAGGCC TACACCGGCG CGCCGTTCTC GCTGCGTCGG 
TTCTACCGGC ACGACCTGCC TGCGCTCCTG CGCGACTATC GCACGCCATT GCTCGTGGCG 
CTGCTGGCAG CAATCGCTGG CGCGCTGTGC GGTCCGCTCC TCGGAGGCTT CTTCGACCGG 
ATCGGGCAGT CGCCGGGGCG CGTCGGCATC ACGCCGGAGC CGAGCCTGGC GCTTGGCATC 
TTCACCGGCA TCGCCAACAG CGCGCGCCTG CTGATCACGG CGCTGCTGGC AACCTTCACG 
TTCGGCATCT TTTCGCTCAT GGTGCCGTTC TTCGCCTTCG GCGGCATCGG GTACATCGCC 
GGGGCGCTGA TGGCAGGCGG CGGCGACTGG CTGACGCTGG GACCCGATAG CCCGCTTCAG 
TTTGTGATTG GCTATGTGCT GCCGCATGGC ATCATCGAAC TGCCCGCTGC CCTGCTCGGC 
GCGGCGCTCG GCATCCGCAT CGGCGCCGCC GTGATGGCTC CGCCAAAAGG GTTCACCGTC 
GGGCAGAATA TCCTCTGGTC GCTAGCGCAG TTCGGTAAAG TGTGGCTCTT CGTCATCCTG 
CCGATGTTCC TGCTGGCAGG GATTGTCCAG CAACTGATCA CGACGCGCAT TCTGGCGGCG 
CTGTACGGAT AA

Protein sequence

MSAVSAIRII VRREVNDTLT DWRILVPIFI LTFVLPQLLI AASSVAIDFV GDRGSVVRLI 
PFAMLLVGFI PASFSLITAL ESFVGERERN SLEALLSMPL SDHALYLGKL LSALIPPLMS 
SLLAMTIFGI SLRVREPDLF FDGLTFEYLV VVLLLILVKA VVMVAGAVII SSHTTSIRAA 
NLLASFVLLP TAATIQLEAL LIIARRWDVL WLAVALLLVI AAVLTRTGMG AFNREEILSR 
EHEQLNLRHI AQTFLTFARE YQPAGTPPEA YTGAPFSLRR FYRHDLPALL RDYRTPLLVA 
LLAAIAGALC GPLLGGFFDR IGQSPGRVGI TPEPSLALGI FTGIANSARL LITALLATFT 
FGIFSLMVPF FAFGGIGYIA GALMAGGGDW LTLGPDSPLQ FVIGYVLPHG IIELPAALLG 
AALGIRIGAA VMAPPKGFTV GQNILWSLAQ FGKVWLFVIL PMFLLAGIVQ QLITTRILAA 
LYG