Gene Franean1_1709 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1709
Symbol
ID	5670111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2041745
End bp	2042938
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	73%
IMG OID	641240627
Product	carbamoyl phosphate synthase small subunit
Protein accession	YP_001506053
Protein GI	158313545
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0706412
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0202078
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGGCT TGGACAGGCA GCCGGCTCCG CCGGAGCGGG AACAGGCCCG GCGCGGGCCG 
GGAGCGCCCC GCCGCGCGGT GCTCATGCTC GAGGACGGCC GGAGCTTCGC CGGGGACGCG 
TTCGGCTCGG TCGGCGAGGC GTTCGGCGAG GCGGTCTTCT CCACCGGGAT GACCGGCTAC 
CAGGAGACCC TCACCGACCC GTCGTTCCAC CGTCAGGTCG TGATCATGAC GGCGCCGCAC 
ATCGGCAACA CCGGGGTGAA CGACACCGAC TACGAGTCCG ACCGCATCCA GGTGGCCGGC 
TTCGTTGTGC GGGACCCGAG CCGGCTGGCG TCGAACTGGC GCGCCCAACG CACCCTGGAC 
GACGAGCTCG AGAACGCCGG CGTGGTCGGG ATCAGCGGGG TCGACACCCG CGCGCTGACC 
CGTCACCTGC GCGAGCGCGG CGCGATGCGG TGCGGGGTCA GCAGCACCGA CACCGATCTC 
GACTCGCTGC TCGACCGGGT GCGCGAGTCG CCGGAGATGG TCGGCGCGGA CCTCGCCCCG 
GAGGTCAGCA CGGACAAGCC CTACGTCGTC GAGGCGCGGT CGGGCCTGCC GCTCTTCACC 
GTCGCCGCGC TGGACCTGGG CATCAAGCGG AACACCCCGC TCTCCATGGC AGCGCTGGGC 
TGCGAGGTGC ACGTGCTGCC GGCCCGCAGC ACGGCCGCCG AGCTGCTGGC CCTCTCGCCC 
GACGGGGTCT TCCTCTCGAA CGGCCCGGGT GACCCGGCCC GCGCGGACTA CGCGGTCGAG 
ACGCTCACCG GGGTGCTGGA GGCGGGTGTC CCCGTCTTCG GGATCTGTTT CGGCAACCAG 
GTGCTCGCAC GGGCCCTGGG CTTCGAGACG TACAAGCTGA CCTACGGCCA CCGCGGCGTG 
AACCAGCCCG TGGCCGACAC CCGGACCGGC CGGATCGCGG TCACCAGCCA CAACCACGGC 
TTCGCGGTGC GCGCGCCGCT GACCGGTACG ACCGACACCC CCTACGGGCG GGTCGAGGTG 
AGCCACGTGG CGCTCAACGA CGACGTGGTG GAGGGCCTGA CCTGCCTGGA CGTGCCGGCG 
TTCAGTGTCC AGTTCCATCC CGAGGCGGCG CCTGGCCCGC ACGACGCCCA GGGACTGTTC 
GACCGGTTCT GCGGCCTGAT GGCGGCCGGC CGGCGGAAGC GGGGAGAAGG CTGA

Protein sequence

MTGLDRQPAP PEREQARRGP GAPRRAVLML EDGRSFAGDA FGSVGEAFGE AVFSTGMTGY 
QETLTDPSFH RQVVIMTAPH IGNTGVNDTD YESDRIQVAG FVVRDPSRLA SNWRAQRTLD 
DELENAGVVG ISGVDTRALT RHLRERGAMR CGVSSTDTDL DSLLDRVRES PEMVGADLAP 
EVSTDKPYVV EARSGLPLFT VAALDLGIKR NTPLSMAALG CEVHVLPARS TAAELLALSP 
DGVFLSNGPG DPARADYAVE TLTGVLEAGV PVFGICFGNQ VLARALGFET YKLTYGHRGV 
NQPVADTRTG RIAVTSHNHG FAVRAPLTGT TDTPYGRVEV SHVALNDDVV EGLTCLDVPA 
FSVQFHPEAA PGPHDAQGLF DRFCGLMAAG RRKRGEG