Gene Sare_4774 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4774
Symbol
ID	5704441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	5402649
End bp	5404070
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	67%
IMG OID	641274172
Product	hypothetical protein
Protein accession	YP_001539518
Protein GI	159040265
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0272932
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000356618
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCGGCC TGGCTCTCGC CACCATAGGT GTCGCCGCCC CGGCCGCGGA CGCGGTCGGA 
CGCCCGCTCA CCTCCGCCGA CGAGCAGCCC TCCGCCGACG AGCGCCGCAG CGGGGGTGAG 
CCCGGTAAGG GCGAGTCCGG CAAAGGTGAG TCCGGTAAGG GCGAGCCCGG CAAGGCCGAG 
TCCGGCAAGG GTGACCCTGG CAGAGGCGAG TCCGGCAGGG GCGAGTCCGA TCAGGGCAAG 
GGCAAGAAGG AGCCGAAGCC GAAGGGCGTT CCGGTCCCCT GTGACGCGGA CAAGCTGATC 
GCCGCGATCA CCCTGGCCAA CGCCCGCGGC GGCGCCGTGC TCGACCTCGC CAAGAAGTGC 
ACCTACCTGC TCACCGCCAC CATCGACGAC GGCGCCGGCC TGCCGGTTGT CACCGCCCCC 
ATCACCCTCA ACGGCGGCAA ACACACCACC ATCAAACGCG CCGCCGGGGT GGAGGAGTTC 
CGCATCGTCA CCGTCGGCAC CGGCGGTGAC CTCACCCTCA ACCACCTGAC AATCACGGGT 
GGACAGACTG ACGGCGATGG CGGAGGAATC CTGGTCAACG CCGGCGGAGC GTTGACCACC 
AACCACAGCA CCGTCACCCG CAACATCGCT GGCAGCGACG GCGGCGGAAG CAGCGGCGGT 
ATCGCCAACA ACGGCACCAC CACCATCAAA CACTCCGCCG TCAGCCGCAA CACTGCGGCA 
ACCGCCGCTG GAGGCATCGG AAACACCGGT CAACTCGCCA TCAAGAAATC CTCCGTCACC 
GCGAACATGG CCAACGCCGT CGTGGGCGGG TTCGGTGGAG GTGTCGGTAG CTTCCCCGGC 
GGCACCACGG TCGTGACTGG CAGCACCATC AGCGGTAACC ACGCCGGCGA CGCTGGTGGG 
GGTGCCGGCG GCTTCAACGC GAACGTCACC GTCACCGACA CCGCCATCAC CGGTAACAGA 
GCCAGCAACG GCGGCGCGGT CTTCGCGGAG GGGGGCATGC TGGCCCTACG CCACGTCACA 
GTCACCAACA ACACCGCCAC CCTTCAGGGC GGCGGCCTCA GCCTCCAAGC CCTCAACGCG 
GCGACCGTGG CAACCGTCGC GGACAGCACA ATCGCGCACA ACGTCGGCAG TCTGAACGGT 
GGAGGTATCG TCAACGCCGC GATCGCCTTC GCCTCCACAC TCGACGTGCG GAACACCCAC 
ATCACGGCCA ATCAGGCAAC ATTTGGTGGC GGAATCTTCA ACATCGCCGT TGACGCCACG 
GTCACGCTCA CCAACACGAA GGTCATCAAG AACATCGCCA TCAGTACTGG CGGGGGCATC 
CTCAACTCGG GCGGAACGGT GAACCTGAAC ACGGCCACCG GTACCGTCGT GGTCAAGAAC 
CGGCCAAACA ACTGCGTCAA CGTGCCCGGC TGCGTCGGAT AG

Protein sequence

MTGLALATIG VAAPAADAVG RPLTSADEQP SADERRSGGE PGKGESGKGE SGKGEPGKAE 
SGKGDPGRGE SGRGESDQGK GKKEPKPKGV PVPCDADKLI AAITLANARG GAVLDLAKKC 
TYLLTATIDD GAGLPVVTAP ITLNGGKHTT IKRAAGVEEF RIVTVGTGGD LTLNHLTITG 
GQTDGDGGGI LVNAGGALTT NHSTVTRNIA GSDGGGSSGG IANNGTTTIK HSAVSRNTAA 
TAAGGIGNTG QLAIKKSSVT ANMANAVVGG FGGGVGSFPG GTTVVTGSTI SGNHAGDAGG 
GAGGFNANVT VTDTAITGNR ASNGGAVFAE GGMLALRHVT VTNNTATLQG GGLSLQALNA 
ATVATVADST IAHNVGSLNG GGIVNAAIAF ASTLDVRNTH ITANQATFGG GIFNIAVDAT 
VTLTNTKVIK NIAISTGGGI LNSGGTVNLN TATGTVVVKN RPNNCVNVPG CVG