Gene Sare_4571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4571
Symbol
ID	5705354
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5189408
End bp	5190496
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	65%
IMG OID	641273982
Product	putative transposase
Protein accession	YP_001539329
Protein GI	159040076
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.225329
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00149389
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTGGTC GTCCGCGTGG TGTGGTGGAA CTGACTGATG ACGAGCGTGC GTGTCTGAGC 
CGGTGGGCGC GGCGGGGTAA GTCGTCGCAG GCGTTGGCGT TGCGGTCGAA GATCGTGTTG 
TTGTGCGCCG ATGGCCTGGT GAACACGCAT GTCGCGCTGC GGCTTGGGGT GTCGCGGGAC 
ATGGTGGGTA AGTGGCGTAG CCGGTTCCTG GCGCGTCGGT TGGAGGGCCT TGTTGACGAG 
CCTCGGCCGG GGGCGCCTCG TCGGATCAGC GACGACCGGG TCGAGGAGGT GATCGTGAAG 
ACCCTCGAAC GGCAGCCGGC CAATCGGGAC AGTCACTGGT CGACCCGGTC GATGGCGCGC 
GAGACCGGGT TGTCACAGAC GGCGGTGTCG CGGATCTGGC GGGCGTTCGG TCTCAAACCG 
CATCTGGTGG ACACCTGGAA GTTGTCGGCT GACCCGATGT TCGTGGAGAA AGTCCGTGAC 
GTGGTGGGTC TGTACCTGGA TCCGCCGGTC AAGGCGATGG TGCTGTGCGT TGATGAGAAG 
TCGCAGATGC AGGCCTTGGA GCGGACCCGC CCGATGCTGC CGATGATGCC CACGGTCCCG 
GCGAGGCAGA CCCATGACTA CGTCCGTCAC GGCGTGGCCA GCCTGTTCGC CGCGTTCGAC 
CCGGCAACAG GCAAGGTCAT CGGCCAGGTG CACCGCCGGC ACCGCCATCA GGAGTTCCTA 
AAGTTCCTGA AGGTCATCGA CGCCAACACC CCCGCCGAGG TGGACCTGCA CCTGGTCCTG 
GACAACTACG CCACCCACAA GACCCCAGCC GTGCACCGCT GGCTGGCCGC GCACCCCCGC 
TTCCACCTGC ACTTCACCCC GACATCAGCA TCCTGGCTCA ACCTCGTCGA GCGCTGGTTC 
GCCGAACTGA CCAACCGCAA ACTCCGCCGG TCCAGCCACC GCAGCCTCAC CGACCTCGAA 
ACCGACGTAC AGACCTGGAT CGAGGCATGG AACACCGAAC CGAAACCGTT CGTCTGGACC 
AGAACCGCAG ACGAAATCAT GAGCAGCCTC GCCGCATACT GTGGTCGAAT TAACGACTCA 
GGACACTAG

Protein sequence

MAGRPRGVVE LTDDERACLS RWARRGKSSQ ALALRSKIVL LCADGLVNTH VALRLGVSRD 
MVGKWRSRFL ARRLEGLVDE PRPGAPRRIS DDRVEEVIVK TLERQPANRD SHWSTRSMAR 
ETGLSQTAVS RIWRAFGLKP HLVDTWKLSA DPMFVEKVRD VVGLYLDPPV KAMVLCVDEK 
SQMQALERTR PMLPMMPTVP ARQTHDYVRH GVASLFAAFD PATGKVIGQV HRRHRHQEFL 
KFLKVIDANT PAEVDLHLVL DNYATHKTPA VHRWLAAHPR FHLHFTPTSA SWLNLVERWF 
AELTNRKLRR SSHRSLTDLE TDVQTWIEAW NTEPKPFVWT RTADEIMSSL AAYCGRINDS 
GH