Gene Sare_4768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4768
Symbol
ID	5707485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5397653
End bp	5399677
Gene Length	2025 bp
Protein Length	674 aa
Translation table	11
GC content	73%
IMG OID	641274166
Product	carbamoyl-phosphate synthase L chain ATP-binding
Protein accession	YP_001539512
Protein GI	159040259
COG category	[I] Lipid transport and metabolism
COG ID	[COG4770] Acetyl/propionyl-CoA carboxylase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000366282
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGATCAGCA GACTTCTGGT CGCCAACCGG GGCGAGATCG CCCGCCGGAT CTTCACCACC 
TGCCGGGCGC TCGGGATCGG GACAGTCGCC GTGCACTCCG ACGCGGACGC CGACGCGGCC 
TTCGTCGCCG AGGCCGACCA CGCCGTCCGG CTGCCCGGAA ACACGCCCGG CGAGACGTAC 
CTGCGGATCG ACCTCGTCCT GGACGCGGCT CGACGGGCCG GTGCCGACGC CGTTCACCCG 
GGCTACGGCT TCCTCGCCGA GAACGCCGAG TTCGCCACGG CGGTCACCGA CGCCGGGCTG 
ACCTGGGTCG GGCCGCCGGC CAAGGCGATC GCGGCGATGG GTGACAAGCT CGCGGCGAAG 
ACACTGCTCG CCGAGGCCGG CGTCCCCATG CTGCCCAGTT GGACCGAACC CGACCAGGTC 
AGCGGCTTCC CGGTGCTGGT GAAGGCATCC GCCGGAGGTG GTGGACGGGG CATGCGTGTG 
GTCCGCGCCG CCGACGGACT CGCCGATGCC GTCGCCAGCG CACGCCGCGA GGCGGCCTCC 
GCCTTCGGCG ACGGCACGGT CTTCATCGAG CGGTACGTCG AACGCGGCCG GCACGTCGAG 
GTGCAGATCC TGGGCGACCG GTTCGGAACG GTGACGGCCC TGGGCGCGCG GGACTGCTCG 
ATCCAACGCC GCCATCAGAA GATCGTCGAG GAGGCGCCGG GCGTCCTCGC ACCCGAGGTG 
CGTCAGCGAC TCCACGAGGC GGCGACGGCC GCTGGGCGGG CGGTCGACTA CGTCGGCGCG 
GGCACGGTCG AGTTCCTACT CGCCCCGGAC GGTGACATCT TCTTCCTGGA AATGAACACC 
CGCCTCCAGG TGGAGCACCC GGTGACCGAG CTGACCACCG GCCTGGACCT GGTCCGCCTG 
CAACTGCTCG TCGCCGAGGG CGCACCGCTG CCGATCACCA CGCCCCCACC GACCACGGGG 
CATGCGATCG AGGTGCGCCT CTGCGCCGAG GACCCGACCC AGGGGTACCG GCCGGCAACA 
GGCACCCTGC ACCGGTTCAC GGTTCCCGCG GTGGCCACCG AGTTCGGGCC GCTGACCGGG 
CCGGGTCTGC GGCTGGACTC GGGCGTGACT GATGGCTCGG TGGTGAGCGT CCACTACGAC 
TCGATGCTCG CGAAGGTGAT CAGCTGGGCG CCTACCCGGG ACGAGGCGGC CCGCGCGCTG 
GCCGGCGCGC TGGCGCGGGC CGAGCTGCAC GGCGTCGCCA CCAACCGGGA TCTGCTGGTA 
CGCATCCTGC GTAGTCCGGA GTTCGCCGCT GTTGACATCG ACACTGGCTT CCTGGACCGG 
CACCCGGAGG TCTTCGCGCC GCTGCTTCCC CCGGAGGAGC TGCCGGTGGC CGCGGTGGCG 
GCGGCGCTCG CCTCGGCCGC CGACCGCCGC GCCAGCGCCC CGGTGCTGGC CGGGCTCCCC 
TCAGGCTGGC GCAACGTGTC CGCCTTCCCA CAGGTCACGC GCTACGCCGG CCCGGACGGC 
GGGGAAATCG AGGTGCGGTA CCGCCTGGAC CGTCGAGGCG CGCTCGCCGA ATGGTCGGTG 
GCACCGGGGG ACGACCCGCC CGCTGCCGGC GACGCCGCCT TCCCGGCCGG CGTGGCGCCG 
GCCCTCACCC TGGTCGAGGC GCACCCGGAC CGGGTCGTGC TGGATGTCAC CGGGGTGCGG 
CGAACGTACC GGGTACACCG GGTGGGCCCG GAGGTCTTCG TGGACAGCCC GGACGGCGCG 
CTGGGCCTGA CCGAGCTACC ACGCTTCCCG CTACCGGGCG CGGAACTGGC GGCCGGGTCG 
CTGCTCGCGC CACTTCCCGG CACGGTGACC CGCGTGCACG TCGAGCTCAG CCAGCGGGTC 
GCCGCCGGTG ACCTACTGCT GACCCTGGAA GCGATGAAGC TGGAACACCC CGTACTCGCC 
CCCACCGACG GCGTGGTCGC CGAGTTGCCG GTACCCGCCG GCGGCCAGGT CGAGACCGGC 
GCCGTACTGG CCGTGGTCAA CCCCGACGAG GAGGCACAGT CATGA

Protein sequence

MISRLLVANR GEIARRIFTT CRALGIGTVA VHSDADADAA FVAEADHAVR LPGNTPGETY 
LRIDLVLDAA RRAGADAVHP GYGFLAENAE FATAVTDAGL TWVGPPAKAI AAMGDKLAAK 
TLLAEAGVPM LPSWTEPDQV SGFPVLVKAS AGGGGRGMRV VRAADGLADA VASARREAAS 
AFGDGTVFIE RYVERGRHVE VQILGDRFGT VTALGARDCS IQRRHQKIVE EAPGVLAPEV 
RQRLHEAATA AGRAVDYVGA GTVEFLLAPD GDIFFLEMNT RLQVEHPVTE LTTGLDLVRL 
QLLVAEGAPL PITTPPPTTG HAIEVRLCAE DPTQGYRPAT GTLHRFTVPA VATEFGPLTG 
PGLRLDSGVT DGSVVSVHYD SMLAKVISWA PTRDEAARAL AGALARAELH GVATNRDLLV 
RILRSPEFAA VDIDTGFLDR HPEVFAPLLP PEELPVAAVA AALASAADRR ASAPVLAGLP 
SGWRNVSAFP QVTRYAGPDG GEIEVRYRLD RRGALAEWSV APGDDPPAAG DAAFPAGVAP 
ALTLVEAHPD RVVLDVTGVR RTYRVHRVGP EVFVDSPDGA LGLTELPRFP LPGAELAAGS 
LLAPLPGTVT RVHVELSQRV AAGDLLLTLE AMKLEHPVLA PTDGVVAELP VPAGGQVETG 
AVLAVVNPDE EAQS