Gene Cagg_0414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0414
Symbol
ID	7266582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	512944
End bp	514293
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	55%
IMG OID	643565281
Product	argininosuccinate synthase
Protein accession	YP_002461795
Protein GI	219847362
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAAA TCTTGCAGCA TCTACCGGTC GGTGAGAAGA TCGGGATCGC GTTTTCCGGC 
GGTCTCGACA CCAGTGCCGC CATTCACTGG ATGCGGGCAA AAGGTGCAAT TCCCTACGCT 
TACACCGCAA ATCTCGGCCA GCCCGACGAA CCTGACTATG AAGATATTCC ACGGCGGGCA 
TTGCTGTATG GCGCCGAGGC AGCACGATTG ATCGACTGCC GTCACCAACT CGTTGCCGAA 
GGGTTGGCAG CACTCCAATG TGGAGCCTTC CATATCTCGA CCGCCGGTCT GCCGTACTTT 
AACACCACCC CCCTCGGTCG TGCCGTTACC GGAACAATGC TGGTTGCGGC AATGCGTGAA 
GATGGCGTCA ATATTTGGGG TGATGGTAGC ACTTACAAAG GAAATGACAT CGAACGTTTC 
TACCGTTATG GGCTGCTCGT CAACCCCGAT CTGCGCATCT ATAAACCGTG GCTCGATCAG 
GCGTTTATTG ATGAGCTGGG TGGGCGCGCC GAGATGTCGG CGTACTTGAG CCGAGCCGGA 
CTAGAGTATC GTATGCCGGC CGAAAAGGCG TACTCAACCG ACTCGAACAT TCTCGGTGCT 
ACTCACGAAG CGAAGGACCT CGAGTTTCTC GATCGCAATA TCACGATTGT CAATCCGATT 
ATGGGCGTCG CGTTTTGGCG ACCAGAGGTG CCGATCGAGT ACGAAGAGGT GCGGATCACC 
TTTGAAGAAG GGTTTCCGGT CGCAATTAAC GGGACGACCT TCCGCGATCA CGTTGAGTTG 
ATGCTTGAAG CCAACCGGAT CGGTGGCCGA CACGGCCTGG GAATGAGTGA TCAGATCGAA 
AACCGGATTA TCGAAGCGAA GAGCCGTGGT ATCTATGAAG CACCGGGAAT GGCACTGCTC 
TTTATCGCTT ACGAACGGCT GGTTACCGGC ATTCATAATG AAGATACTAT CGACCAATAC 
CGTGAGTACG GACGCAAATT GGGACGGTTG CTGTATGCCG GACGTTGGTT TGACCCCCAG 
GCGATGATGA TCCGGGAGTC GCTGCAACGT TGGGTGGCCC GCCTCATTAC CGGTGAGGTG 
ACCATCGGTT TGCGACGAGG CAACGATTAC TCGATCCTCG ATACAAGCTC ACCGAATTTG 
ACGTATGATC CGAGCCGGTT AACAATGGAG AAGGGGGAAG CCAGTTTTAC CCCCCAAGAT 
CGGATCGGTC AATTGCATAT GCGCAATAAC GATATTGCCG ATACACGTAA GAAGTTGTTG 
GTGTACTTGC GCACCGGCTT ACTCGGCGAG AGTGGCGTGT TGCCCCAGCT CACCCCACCG 
AGTGATGAGA GCACGACGGC GCAAGAGTAA

Protein sequence

MAKILQHLPV GEKIGIAFSG GLDTSAAIHW MRAKGAIPYA YTANLGQPDE PDYEDIPRRA 
LLYGAEAARL IDCRHQLVAE GLAALQCGAF HISTAGLPYF NTTPLGRAVT GTMLVAAMRE 
DGVNIWGDGS TYKGNDIERF YRYGLLVNPD LRIYKPWLDQ AFIDELGGRA EMSAYLSRAG 
LEYRMPAEKA YSTDSNILGA THEAKDLEFL DRNITIVNPI MGVAFWRPEV PIEYEEVRIT 
FEEGFPVAIN GTTFRDHVEL MLEANRIGGR HGLGMSDQIE NRIIEAKSRG IYEAPGMALL 
FIAYERLVTG IHNEDTIDQY REYGRKLGRL LYAGRWFDPQ AMMIRESLQR WVARLITGEV 
TIGLRRGNDY SILDTSSPNL TYDPSRLTME KGEASFTPQD RIGQLHMRNN DIADTRKKLL 
VYLRTGLLGE SGVLPQLTPP SDESTTAQE