Gene RoseRS_1122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1122
Symbol
ID	5208069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	1398540
End bp	1399760
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	64%
IMG OID	640594735
Product	laminin G
Protein accession	YP_001275479
Protein GI	148655274
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCGCT TTCCCACATT CCCGTTCAAC GAACGCTTCC AGCGCGCAGG ACGTGCGCTC 
GTGGCGCTGG CGCTGCTGCT GACCGTTCTG CCAGAATCCA TCCGGGCGCA GGGCGACTTC 
TCGCTCCGCT TCTATGGCAC AGGACGCGAT GGCGTTGACC GCGTGATGAT CCCGCTCGAT 
GCGCCGCCGC GTCCGGTCGA CGTTGGCGGC GATTTCACCA TCGAATTCTG GCTCAAGGCG 
CTTCCCGGCG ATAATGCGGC GTCAGCCTGC TCTCCCGGCG AGGACAACTG GATCTACGGC 
AATGTCGTCA TCGACCGCGA TGTCTACTTT GCCGGCGACT ACGGCGACTA CGGCATCTCG 
CTCGCAGACG GGCGCATTGT GTTTGGCGTC AATAACGGAT CAGAAGGAAC AACCCTCTGT 
GGCCAAACGA ACGTAACCGA CGGTCGCTGG CATCATATTG CGCTGACACG TTCCGCCTCC 
AATGGCAGCC TGGCAATCTT CATCGATGGA CGCCTCGACG CCCGTGGGGA AGGACCGACC 
GGCGACGTCA GTTACCGCGA CGGGCGTGCA ACCCAGTACC CCGCCGATCC CTTCCTCGTG 
ATCGGCGCTG AAAAACACGA TGCCGGTCCC GAATATCCGT CGTTTCGCGG ATGGCTCGAT 
GACGTTCGCA TTTCGCGCAT CATCCGCTAC CGTGGCGCGT TCACCCCGCC AACCGCTCCC 
TTCACGCCCG ATGCCGACAC AGTTGCGCTC TATCACTTCA ACGAAGGCGC TGGCGCCACA 
GTCCGCGACT CATCGGGCGC ATCGGGTGGT CCCAGTGATG GCGCTCTGCG CGTCGGCGGA 
TCACCCGCCG GTCCTGCCTG GTCCGAAGAT ACCCCCTGGA TCAGTTCGAG CGCATCACCG 
CCCTCACCGA CATCTCCGCC ATCACAGGGT GCGCCAGCGC TGTCACCGCA ACCATCGCCC 
ACCACAATCA TTGCTGTCGT CACGAACGTC CCGCTGCCGA CAGACACACC CGTTCCACCA 
ACACAACCAG CGAGTGCAGC GTCTCCCCCG ACGTCCACAT CCCTTCCCTC TCCAACACTA 
CCGACCGCCG GAATCGTTGC ACCCTCGCCA ACGCCTGGCG CTGCGCCCGC GCCTCCCAAT 
CCACCGTACT GGCTGCTCAT CATTGCGGTC GCCGGACTGG CGCTGGCTGG CGTCGGGGTG 
GCGCTCATGC GCCGGAGGTA A

Protein sequence

MGRFPTFPFN ERFQRAGRAL VALALLLTVL PESIRAQGDF SLRFYGTGRD GVDRVMIPLD 
APPRPVDVGG DFTIEFWLKA LPGDNAASAC SPGEDNWIYG NVVIDRDVYF AGDYGDYGIS 
LADGRIVFGV NNGSEGTTLC GQTNVTDGRW HHIALTRSAS NGSLAIFIDG RLDARGEGPT 
GDVSYRDGRA TQYPADPFLV IGAEKHDAGP EYPSFRGWLD DVRISRIIRY RGAFTPPTAP 
FTPDADTVAL YHFNEGAGAT VRDSSGASGG PSDGALRVGG SPAGPAWSED TPWISSSASP 
PSPTSPPSQG APALSPQPSP TTIIAVVTNV PLPTDTPVPP TQPASAASPP TSTSLPSPTL 
PTAGIVAPSP TPGAAPAPPN PPYWLLIIAV AGLALAGVGV ALMRRR