Gene Sare_1673 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1673
Symbol
ID	5704570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1926363
End bp	1927619
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	70%
IMG OID	641271177
Product	hypothetical protein
Protein accession	YP_001536552
Protein GI	159037299
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.595687
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAGAC TGGGTCGTAC CGTCCTTGCG GCGGGAATCG CCGTCGTCAC GGCCACATTC 
GCTGCGACAG TCGCACCGTC GGGTCCGGCC GAGGCGACAC CGCCCACCGC CGCGGTGGCA 
CTCGGCGACA GTTTCATCAG CGGCGAGGGT GCCGGGGCGT ACTCTCCCGT GGTCAACATC 
GACGGGGAAA CCAGCACCTT CCCGGGATGG TCCGCGCCGA ACAGCAACGC ATACTTCTGC 
CACCGCTCGA CGAACGCCTC GCTACACCGG GCCGACCTGC CCGGCATCAC GGCCCGCTTC 
AACCTCGCCT GCTCGGGCGG ACAGCCGTAC GACATCGCCA ACGCCTCCGC CACCCGGACC 
AGCGGGCGTC AGGTCGCGGC CCAGCTCGAC CAGCTCCGCG CGGTGGCCCA GACCCACGAC 
ATCGACCTGG TGCTCGTCGG GCTCGGCTCG AACAACAGCT CGTTCACCTT CGGCTCGGTG 
GCCGAGAAGT GCGCCAACCG ATTCATCGCC GACGCCTGGA CCGGCTGGTG GGAGTTCTGG 
GCGTACCTGT GGGGAAAGGT GGAGCAGGAG CCCTGTTCCA ACAACGACCT GGCGACCGCC 
GCGGAGCTCG CCGCCGCCAC CGCGGAGACC ACCGCGGCGG TCCGACAGAT CCTCAGCACG 
CTGGCCGAGG TCGACGCCGA CGGGCAGCAC CGGGTCGTCC TCCAGGACTA CACGAACCCG 
CTGCCGGAGG AGTACGACCC CACCTACTGG ACGGAGGACA ACCGCGACGA CACGCGGGAC 
AAGTTCCGCG ATCTCGGCGC CGAACGGTAC GCGGCCGGTT GCCCAGCCCA CCGGGCCAGT 
CTGCCCGCCG GCCACTATCT CTCGCAGGGC CTGGGAACCC TGGTGAGCGA TGTCCACACC 
ACCGTCGCGG ACGAGTTCCC CGGCGCCGAC GTTGTCCTCC TCAACGTGCA GCGAGCCTTC 
GACGGAGCCC GGCTCTGTGA GACGGCGGAC AGCCCACAGA ACGCCCTCGC CACCCCGGTT 
CGTCTGATGG ACGGGCCGAC CGGCGTCTTC GTCACCAGCC TCTCCGGGCT CGACAAGCTC 
GACATCAGGA GGATCGCCAA CGCCTGCGTC ACGAACTTCC AGACGTGCCA GGAATCGTGG 
CACCCGAACG CCGCCGGCCA CCTGACGCTC GGGCACTGCC TGACCGGCGC CGCGGCGACG 
AGCGCCCGTG CAGTGTCCTG CGTCCGTTCC GCATCCGGCG CGATCACCGT GAGCTGA

Protein sequence

MSRLGRTVLA AGIAVVTATF AATVAPSGPA EATPPTAAVA LGDSFISGEG AGAYSPVVNI 
DGETSTFPGW SAPNSNAYFC HRSTNASLHR ADLPGITARF NLACSGGQPY DIANASATRT 
SGRQVAAQLD QLRAVAQTHD IDLVLVGLGS NNSSFTFGSV AEKCANRFIA DAWTGWWEFW 
AYLWGKVEQE PCSNNDLATA AELAAATAET TAAVRQILST LAEVDADGQH RVVLQDYTNP 
LPEEYDPTYW TEDNRDDTRD KFRDLGAERY AAGCPAHRAS LPAGHYLSQG LGTLVSDVHT 
TVADEFPGAD VVLLNVQRAF DGARLCETAD SPQNALATPV RLMDGPTGVF VTSLSGLDKL 
DIRRIANACV TNFQTCQESW HPNAAGHLTL GHCLTGAAAT SARAVSCVRS ASGAITVS