Gene NATL1_21901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_21901
Symbol	argG
ID	4779237
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1850368
End bp	1851570
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	38%
IMG OID	640085488
Product	argininosuccinate synthase
Protein accession	YP_001016010
Protein GI	124026895
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.898377
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAAGG CTAAAAAAGT TGTTTTGGCT TATTCAGGAG GGGTTGATAC TAGCGTTTGT 
ATTCCTTACT TGAAGAAGGA ATATGGAGTC GAGCATGTAA TTGCATTTGC AGCAGATCTT 
GGTCAAGGCG ACGAGCTTGA TCAAATCAAA CAAAAGGCTA TTTCAGCAGG AGCTTCAGAA 
TCTTTAATTG GCAATTTGGT AAAGCCTTTC ATAGAAGATT TTGCTTTCCC AGCGATTAGA 
TCTAATGCTT TGTATCAAGG TAGATATCCT CTTTCAACGG CATTAGCTAG ACCATTAATT 
GCAAAAAACC TTGTTGAAAT TGCAAGGGAA CTAAATGCCG ATGGAGTCGC TCACGGGTGT 
ACGGGCAAAG GGAACGATCA AGTGCGTTTT GATGTGACTA TTGGAGCTTT AGCTCCTGAT 
TTGCAATTGC TTACACCAGC ACGGGAATGG GGTATGAGCC GCGAAGAAAC CATTGCCTAT 
GGAGAAAAAT ATGGAATAGT TCCCCCTGTA AGTAAAAAAA CTCCTTACTC GATTGATTTG 
AATCTTTTGG GGAGAAGTAT TGAAGCTGGT CCTCTTGAAG ATCCATTTGA GATGCCATCA 
GAAGAAGTGT TTGGCATCAC TTCTTCTATA GCTGATTCAC CAAACGAGCC TGAGATAGTA 
GATATTTTGT TTGAAAATGG TTATCCAGTT GCAATTAATG GAGAAGCGAT GGAGCCAGTA 
TCCCTGATTA AAAAAGCTAA TAGCCTTGCA GGAAAGCATG GCTTTGGACG TTTGGATATT 
ATTGAAGACA GAGTAGTAGG AATTAAAAGT CGAGAAATTT ATGAAACTCC AGGATTGCTT 
TTATTAATTA AAGCTCATCA GGAAATTGAG AGTTTAACTT TACCTGCCGA CTTATTAGAT 
ACTAAATTTA GACTCGAACG ACAATGGGCA GACTTGGTTT ATAAAGGTTT TTGGTTTAGT 
CCTCTAAAAG AAGCTTTGGA TGGATTTATT AATTATTCTC AAAAGCAAGT GAATGGAACA 
GTCAGGGTTA GGCTTTTTAA GGGTAATGTC GATGTTATAG GTCGCAAGTC AAAAGAAAAT 
AGTTTGTATA TTTCAGATAT GTCTACTTAT GGAAGTGAGG ATAAGTTCAA TCACAAATCC 
GCTGAAGGAT TTATATATGT ATGGGGATTG CCTAGTCGAA TTTGGTCTTG GATAAACAAG 
TAA

Protein sequence

MGKAKKVVLA YSGGVDTSVC IPYLKKEYGV EHVIAFAADL GQGDELDQIK QKAISAGASE 
SLIGNLVKPF IEDFAFPAIR SNALYQGRYP LSTALARPLI AKNLVEIARE LNADGVAHGC 
TGKGNDQVRF DVTIGALAPD LQLLTPAREW GMSREETIAY GEKYGIVPPV SKKTPYSIDL 
NLLGRSIEAG PLEDPFEMPS EEVFGITSSI ADSPNEPEIV DILFENGYPV AINGEAMEPV 
SLIKKANSLA GKHGFGRLDI IEDRVVGIKS REIYETPGLL LLIKAHQEIE SLTLPADLLD 
TKFRLERQWA DLVYKGFWFS PLKEALDGFI NYSQKQVNGT VRVRLFKGNV DVIGRKSKEN 
SLYISDMSTY GSEDKFNHKS AEGFIYVWGL PSRIWSWINK