Gene Francci3_3173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3173
Symbol
ID	3903898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3760264
End bp	3761352
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	73%
IMG OID	637880497
Product	acetylglutamate kinase
Protein accession	YP_482259
Protein GI	86741859
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0548] Acetylglutamate kinase
TIGRFAM ID	[TIGR00761] acetylglutamate kinase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0759623
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.135118
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCCC CGACCCGGAC GCCGCCGCCT TCGAACGGTG GGCACGGCAG CACCGGCAGC 
ACCGGCAGCA CCGGCGACGC CGCCCCGGGC GGGGGCACCG GGCGGGGCCC GGCCGCCACC 
GCCCGCGGCC ATGCGGCGCT CGCGAAGACC CAGGTCCTCA TCGAGGCGCT CCCGTGGCTG 
TCGCGGTTCC AGGGCGCGAC CATCGTCGTC AAGTACGGCG GCAACGCGAT GACGGAGCCG 
GCGCTGCGCG AGGCCTTCGC CGCCGACGTC GTGTTCCTGC GCCACTCGGG GCTGCGGGTG 
GTCGTCGTGC ACGGCGGCGG TCCGCAGATC ACCGCGCATC TGGAGCGCCT CGGTGTCCCC 
TCAACGTTCG TCGGCGGCCT GCGGGTCACC ACCCCACAGA CCATGGACGT CGTGCGGATG 
GTCCTGCTCG GCCAGGTCAA TCGGGACGTC GTGGGGCTCG TCAACGACCA CGGCCCGTTC 
GCCGTCGGGC TGTCCGGTGA GGACGCCAAC CTCTTCACCG CGCGGCGCCG CCCGGCGATC 
GTCGATGGCC GGGAGGTCGA CGTCGGCCTG GTCGGCGACA TCGTCGAGGT CCGACCGGAG 
ACGATCAACG CCCTGCTCGG CTCCGGGAAG GTGCCGGTGG TCGCGTCGGT CGCCCGCGGC 
GTCGACGGCG GGGTCTACAA CGTCAACGCC GACACCGCCG CCGCCGAACT CGCCGTCGCG 
CTCGGGGCTA CGAAGCTCGT CGTCCTGACC GACGTCGAGG GCCTCTACGC GGACTGGCCG 
GCGAGCGACG AGGTGATCAG TGAGCTGAGC ATCACCGAGC TCGAACAGCT CCTCCCCTCG 
CTCACCGCCG GCATGATTCC CAAGATGGAG GCCTGCCGGC GGGCGGTGCG TGGCGGTGTT 
CCGCAGGCGC ACGTGCTCGA CGGACGGGTG CCGCACGCGG TGCTCCTGGA GATCTTCACC 
GACGATGGCA TCGGCACCTT GATCATGGCC GAGTCGGGCA CCTCGCCTGA GCCGGGTACG 
CCCCCCGCAC CCGCCGCGCG CCCGGCCGGG ATCGTTCCGG CCGGCGAACC GACCGGAGGA 
ACGCCATGA

Protein sequence

MNAPTRTPPP SNGGHGSTGS TGSTGDAAPG GGTGRGPAAT ARGHAALAKT QVLIEALPWL 
SRFQGATIVV KYGGNAMTEP ALREAFAADV VFLRHSGLRV VVVHGGGPQI TAHLERLGVP 
STFVGGLRVT TPQTMDVVRM VLLGQVNRDV VGLVNDHGPF AVGLSGEDAN LFTARRRPAI 
VDGREVDVGL VGDIVEVRPE TINALLGSGK VPVVASVARG VDGGVYNVNA DTAAAELAVA 
LGATKLVVLT DVEGLYADWP ASDEVISELS ITELEQLLPS LTAGMIPKME ACRRAVRGGV 
PQAHVLDGRV PHAVLLEIFT DDGIGTLIMA ESGTSPEPGT PPAPAARPAG IVPAGEPTGG 
TP